리포트래시

https://www.reportrash.com/

리포트래시 - 기사의 url 을 제보하면, 기사를 자동으로 분석하여 박제하는 사이트

메인화면에 기사 url을 입력할 수 있습니다.


리포트래시

분석한 내용을 기사, 기사, 미디어, 이슈별로 통계수치를 보여줍니다.


리포트래시

제보를 바탕으로 하면 집단지성을 활용할 수 있도록 아주 많은 사용자를 확보하는게 중요할 것 같은데요.

통계의 신뢰도를 보완하기 위해 어떤 방법들을 사용하는지 궁금합니다.


리포트래시

기자 이름을 클릭하면, 기자에게 제보된 내용의 통계가 표시됩니다.

가짜뉴스, 악의적 헤드라인, 사실왜곡, 통계왜곡, 잘못된 인용, 오보, 헛소리/선동 같은 카테고리로 통계수치가 표시됩니다.

어떤 알고리즘으로 자동으로 분석하는지 궁금합니다.


리포트래시

우선 제보시에 카테고리에 대한 입력을 받는군요.

뒤에 어떤 보완 알고리즘이 있는지는 모르지만, 일단 제보자의 의견이 우선 중요한 듯 싶네요.


사이트 이름부터 도발적(?)이면서, 정치적 입장에 따른 논란도 있는 걸 보면, 사이트 내용이 이슈가 되서 사용자가 많아지길 기대하는 것 같습니다.

그래서 그런지 내용외 사이트에 대한 군더더기 설명이 별로 없습니다. ^^

텍스트 분석에 관심이 많아서, 가짜뉴스나, 헛소리, 악의적 헤드라인 같은 카테고리를 판단하는 알고리즘을 어떻게 구현했을까 궁금했는데.

사실 순수하게 기술적인 방법으로 정확하게 분석하고 통계내기는 어려운 문제 같습니다.

url을 입력받은 후, 내용을 크롤링 해서 자동으로 분석하고 통계를 보여주고, 해당 내용을 아카이빙 하도록 기획된 웹사이트 입니다.