Is online news comment really a voice of people?

Description


N모사와 D모사 뉴스를 보면 기사 내용과는 전혀 무관하다고 할 수 있는 반복적인 댓글이 자주 등장하는 것을 볼 수 있습니다. 하지만 글쓴이의 ID도 같지 않은 경우도 많습니다. 그렇다면 이 글쓴이들은 누구이고, 얼마나 많은 댓글을 쓰고있고, 얼마나 다양한 내용(주제 혹은 실제 글 내용)의 댓글을 쓰고있을까요? 위 질문에 답하기 위해 N모사의 뉴스와 D모사의 뉴스에서 - 댓글들을 크롤링하고 + 저장하는 과정, - 저장한 데이터를 Pandas/Dask를 이용해 전처리하는 과정, - 그리고 몇가지 간단한 데이터 분석 (#잘된것, #망한것) 사례를 통해 '댓글'이라는 방식이 신뢰할만한 데이터 분석의 원천이 될 수 있는지 알아봅니다.


Comments

blog comments powered by Disqus

Sponsors

Diamond

Sappire

Platinum

Gold

Silver

Community

Media