韦尔斯利研究人员开发跟踪Twitter上的真理和谎言的工具

2015年6月15日
彩色图像描绘与Twitter上的一条微博互动,通过TwitterTrails

社交媒体已经成为现代新闻报道的重要组成部分,但努力是第一个报告一个故事往往eclipse准确性和导致虚假信息的传播。输入TwitterTrails交互式web工具开发的韦尔斯利的社会信息学实验室允许记者快速检查在推特上一个主张,跟踪索赔传播多远,并确定它是否似乎是真或假通过分析人的行为遵循的故事。

TwitterTrails是由韦尔斯利教授塔迈塔克瑟白兰地大学教授计算机科学的创始人和媒体艺术与科学计划,和埃尼Mustafaraj、计算机科学助理教授和管理萨曼莎·芬恩的12。这个项目是由韦尔斯利学院和支持亚博永久官网国家科学基金会的资助。根据Mustafaraj, NSF资助为学生就业提供了大量的支持;许多学生研究人员在多种方式导致了项目在过去的几年中。

TwitterTrails作品用一种算法来研究人群的行为。每个故事都评估使用两个主要指标:“传播”(检查有多少故事已经传递)和“怀疑”(检查怀疑在人群中存在多少关于索赔的有效性)。声称获得更高的怀疑和更低的传播更有可能是假的,并声称获得更低的怀疑和更高的传播更有可能是正确的。

“当足够多的人看到相同的信息他们的反应相关信息是否正确或错误,”迈塔克瑟白兰地说。“当很多人看到他们知道的东西是真的,很可能他们会反驳它。然而,当他们看到一些他们知道是假的,一个好的子集,这些人将会提高问题……TwitterTrails措施这两个参数——多少东西是共享与多少怀疑存在确定索赔似乎是真或假。”

几分钟后,TwitterTrails可以检索并返回至关重要的信息,如:谁发布的第一个微博话题;信息传播速度,当它开始蔓延,以及它是否仍然;人们是否表示疑问的索赔;和传播信息的主要参与者。

工具依赖于一个算法来测量和分析人群的行为。使用一个著名度量从图书馆学叫做h指数。h指数,它是由乔治·赫希博士,加州大学圣地亚哥分校的影响决定了作者的排位赛作者引用的出版物;工作的h指数等于(h)的论文数量(h)或更多的引用。

“在我们的使用,数据集的一条微博一个故事对应于一个发布和转发像引用,”迈塔克瑟白兰地说。“转发一条微博增加的可见性,因为这个动作向前推特追随者。它也给了故事的可信度,因为转发一般显示信任和协议的信息。”

在分析“传播”,TwitterTrails使决心通过计算所有微博的h指数对一个给定的故事。计算“怀疑”,系统计算微博表达怀疑的h指数,与h指数进行比较,那些不表达疑问,然后产生一个比基于这两个值。怀疑和不相信可以通过分析在推特上发现正在使用哪些词。据研究人员介绍,因为Twitter短消息,人们倾向于使用相同的词汇来描述事物。表示怀疑或不相信,10时最常见的关键词是:骗局,假的,疑问,假的,诈骗,不真实的,错误,不真实的,虚假的,误导。

“我们发现,对于大多数的英语微博,这些关键词,“TwitterTrails项目经理萨曼莎·芬恩写道在项目的博客。“在大约20%的情况下,然而,这些并不足以捕获大部分微博:有时他们推文小姐应该计算在内,有时他们捕获太多的微博,当人们使用这些话但是没有的意图表示怀疑。为了解决这一问题,该算法可以定制根据story-by-story:单词可以从这个列表中添加或删除,和文字也可以被添加到一个列表,这样他们的存在在一个tweet排除了它。”

TwitterTrails目前为记者正在调查最近和突发事件和社会媒体的研究人员,但其他人可以通过“小道tweet通过提交一个请求请求一个故事“形式。跟踪团队计划工具可用于个人,个人在未来使用。

案例研究和额外的信息,请访问TwitterTrails博客。读故事TwitterTrails网络世界(2014年10月),BostInno(2014年11月),《每日野兽》(2014年11月)。