下载客户端

小道消息漫天飞，辟谣还得靠AI？

2020-11-27 11:29

来源：澎湃新闻·澎湃号·湃客

原创以殷果壳

当长辈在家族群中发“无籽葡萄是避孕药泡过的”谣言推送时，我颤巍巍地把果壳的科普甩进群里，等待长辈的谆谆教诲。但为什么年轻人给老一辈科普还要背上“大不敬”的罪名？如果社交媒体能直接搭载AI识别谣言，只要长辈一发“千滚水不能喝”之类的东西，AI就自动警铃大作，在长辈的手机屏幕上弹出“此条消息是谣言”的警告，岂不美哉！

查证来源是识别谣言的好方法丨Giphy

AI在线查谣言，仍需人类来主攻

其实AI识别谣言并不新鲜。去年，阿里巴巴达摩院的科学家就造了个AI谣言粉碎机，据称谣言识别准确率达81%。阿里开发的AI用的是自然语言处理技术，分三步来判断谣言。

1. AI会找到内容最初的信息源，并分析用户画像。比如用户发表了“韭菜和牛奶相克”的内容，那TA的专业领域是不是医学或者营养学呢？

2. 寻找网上所有的信息源，看内容链接的域名是不是来自可信的网站，比如政府官网或者可信赖的媒体。

3. 将正文里关键的论证提炼为知识点，与知识图谱里的权威知识库做匹配验证。如果毫无联系、自相矛盾，就会减分。

在社交媒体时代，每个互联网用户都是内容生产者，谣言治理是个全球性的难题，除了国内的阿里、今日头条等在AI识别谣言上做出努力之外，国外的脸书、推特等社交媒体为打击假新闻，也搭载了AI来识别谣言。这次美国大选，推特更是严阵以待，利用AI和人工审核，把选举有关的不实内容都打上标记——特朗普的近百条推文就被标记为“不实消息”。

被打上不实消息的推文丨Twitter：@realDonaldTrump

尽管很多人对AI识别谣言寄予厚望，但实际上，现在AI的能力还没想象中的那么强。目前谣言识别仍然依赖人工核查，AI处于补充地位，主要在识别简单重复的虚假内容、假新闻网址和机器人账号上发挥作用。在新冠疫情期间，为对付满天飞的新冠谣言，脸书和全世界60多个事实核查组织合作，先来标记虚假新闻，然后当用户分享假新闻时，AI就能检测到这些内容。到今年4月份，大约有5000万条与新冠疫情相关的虚假内容被打上了“警告”标签。

为什么现阶段在识别谣言上，AI还拼不过人工呢？一些专家认为，AI无法单独胜任谣言识别的工作。尽管AI可以提取某些事实并进行粗略的情感分析，但它无法完全理解人类的写作方式，对文字的语境和语调带来的细微差别束手无策，也没办法自己打电话去求证核实。现在网上冲浪选手喜欢“阴阳怪气”的讽刺表达，除非AI变成人类老油条，不然很难摸清人类写作的真实目的。

“人类，你在说啥？”丨Pexels

打造谎言照妖镜:

故事听起来很脱节？很可能是谣言

除了高频率碰到的健康养生类谣言，新冠疫情期间的种种阴谋论也甚嚣尘上。尽管科学家不断发声辟谣，但“新冠病毒是实验室制造的”等阴谋论依然大有受众，发达的社交媒体更是阴谋论萌发和传播的温床。为了识破阴谋论并将它扼杀在摇篮里，加州大学的文化分析小组也尝试，训练AI来识别谣言和阴谋论的基本特征与内容框架，以便“按图索骥”，谣言一露头就加以控制。

在研究中，研究人员以“披萨门”（pizzagate）和“封桥门”（bridgegate）为例，展示了AI识破阴谋论的原理。

“披萨门”是已被证实的阴谋论，发生在2016年美国大选期间。当时的民主党总统候选人希拉里被指卷入了一个儿童色情团伙，这个团伙在华盛顿特区的大本营是一家披萨餐厅，甚至有一个“披萨门”的拥护者持步枪在该餐厅里开枪，所幸无人员伤亡。而“封桥门”则是一个真实的政治丑闻，2013年，新泽西州长的亲信向政敌进行政治报复，关闭华盛顿大桥的两条通道造成交通拥堵。

披萨门中提及的披萨店丨Wikimedia Commons

研究者开发的AI先从一些论坛上扒下讨论“披萨门”和“封桥门”的帖子，并识别帖子中的人物、地点和事物等元素。当AI提取数据的时候，会把这些故事元素当作节点，并把相关的节点联系在一起，形成一个体系。在比较过程中，研究者就发现了两个明显的阴谋论特征。

首先是完整故事图谱的形成速度。封桥门的故事图谱因为牵扯的元素过多，从2013年到2020年不断发展丰富，花了将近六年才得以完整描述，而披萨门的故事图谱在一个月内就基本稳定成型了。

第二个特征则是故事的“坚固”程度。因为阴谋论者都很喜欢“透过现象看本质”，发现世界的隐藏联系，这就导致故事本身非常容易脱节。披萨门的故事内容是非常松散的，故事图谱的主要元素偏少，联系也比较微弱，如果把关键的元素去掉，整个故事就分崩离析，分解成政治、餐饮、撒旦主义等不太相干的领域。而对于真实事件封桥门来说，因为元素过多，联系紧密，即使删除了丑闻中的关键人物和关系，也能形成一个单一的、相联系的网络，并聚焦于新泽西州的政治问题，故事本身依然成立。

上图为封桥门，联系紧密；下图为披萨门，结构松散丨

https://doi.org/10.1371/journal.pone.0233879

通过这些特征，AI不需要全面收集数据就能近乎实时识破阴谋论，不过加州大学这个“阴谋论识别模型”依旧在完善之中，研究人员不断地将新冠疫情期间流行的阴谋论和针对反疫苗接种运动的谣言“投喂”给它，希望这个识别模型能够早日完成，并基于它开发一个跟踪阴谋论出现和发展的预警系统，提醒网友注意新冒出来的阴谋论。

人类联手AI对抗谣言已经是一个趋势，不过在等待AI变得更“聪明”、扼杀更多谣言之前，提高自身的科学素养和信息甄别能力才是更重要的。

参考文献

[1] Tangherlini, T. R., Shahsavari, S., Shahbazi, B., Ebrahimzadeh, E., & Roychowdhury, V. (2020). An automated pipeline for the discovery of conspiracy and conspiracy theory narrative frameworks: Bridgegate, Pizzagate and storytelling on the web. PloS one, 15(6), e0233879.

[2]https://theconversation.com/an-ai-tool-can-distinguish-between-a-conspiracy-theory-and-a-true-conspiracy-it-comes-down-to-how-easily-the-story-falls-apart-146282

[3]https://www.theguardian.com/technology/2020/nov/11/how-2020-transformed-big-tech-the-story-of-facebook-qanon-and-the-worlds-slackening-grip-on-reality

[4]https://en.wikipedia.org/wiki/Fort_Lee_lane_closure_scandal

[5]https://en.wikipedia.org/wiki/Pizzagate_conspiracy_theory

[6]http://www.xinhuanet.com/local/2019-03/01/c_1124178146.htm

[7]https://www.theverge.com/2018/4/5/17202886/facebook-fake-news-moderation-ai-challenges

[8]https://ai.facebook.com/blog/using-ai-to-detect-covid-19-misinformation-and-exploitative-content/