利用群体智慧,进行大规模的事实审核

来源:混沌巡洋舰

为了应对虚假信息,社交媒体网络和新闻机构经常雇佣事实核查员来区分真假。但事实核查人员只能评估网上流传的一小部分故事。麻省理工学院研究人员的一项新研究提出了另一种方法: 研究指出来自普通读者群体的众包准确性判断,实际上可以和专业事实核查人员的工作一样有效。

“事实核查的一个问题是,对于专业的事实核查人员来说,有太多的内容无法覆盖,尤其是在合理的时间范围内,”Jennifer Allen 说,她是 MIT斯隆管理学院的一名博士生,也是最近在科学进展发表的题为“利用群体智慧扩大事实核查”的论文的合著者。

论文地址:

https://www.science.org/doi/10.1126/sciadv.abf4393

该研究检查了超过200篇Facebook 算法已经标记为需要进一步审查的新闻报道,通过使用相对较小的、政治上平衡的外行读者群体,可评估新闻报道的标题和导语。

“我们发现这令人鼓舞,”Allen表示。“10至15人的平均评分与专业事实核查员的判断相关,而外行事实核查员的判断,相互之间也是相关的。这有助于解决可扩展性问题,因为这些评级员都是普通人,没有经过事实核查培训,他们只是阅读标题和引导句子,没有花时间做任何研究。”这意味着这种众包方式可以广泛应用,而且成本低廉。这项研究估计,让读者以这种方式评估新闻的成本大约是每篇报道0.9美元。

麻省理工学院斯隆管理学院的David Rand教授是这项研究的通讯作者之一,他说: “没有一种方法可以解决网络虚假新闻的问题。但我们正在努力为对抗虚假信息的工具箱中,增加有希望的方法。”

为了进行这项研究,研究人员使用了207篇新闻文章。Facebook 内部的算法认定,这些文章需要进行事实核查,要么是因为有理由相信它们的内容有问题,要么仅仅是因为它们被广泛分享,或者与健康等重要话题有关。该实验使用亚马逊的 Mechanical Turk 平台,征集了1128名美国居民。

研究人员向这些参与者发放了20篇新闻报道的标题和引言,并向他们提出了7个问题ーー这些报道在多大程度上是“准确的”、“真实的”、“可靠的”、“可信赖的”、“客观的”、“没有偏见的”和“描述实际发生的事件”ーー以便为每个新闻项目产生一个总体的准确性评分。

多少个普通人对新闻可靠性的评分(横轴)与专家评分一致性的相关系数,红点代表能看到原文,绿点代表只可看到标题和摘要,上图是全部内容,下面按照新闻是否和政治相关,分为两类

与此同时,三名专业的事实核查人员被要求对所有207篇报道进行调查后的评估。与其他关于事实核查的研究一致,尽管事实核查者的评分彼此高度相关,但他们的一致性远非完美。在大约49% 的案例中,三名事实核查人员对一个故事的真实性都做出了合理的判断; 在大约42% 的案例中,三名事实核查人员中的两人表示同意; 在大约9% 的案例中,三名事实核查人员的评分各不相同。

有趣的是,当研究招募的常规读者被分成民主党人和共和党人数相同的组时,他们的平均评分与专业事实核查者的评分高度相关,而且至少有两位数的读者参与,人群的评分与事实核查者之间的相关性就像事实核查者之间的相关性一样强。

“这些读者没有接受过事实核查方面的培训,他们只是阅读标题和引言句,即便如此,他们也能够与事实核查员的表现相匹配,”艾伦说。

一开始,12到20名读者的表现能与专业的事实核查员相媲美,这似乎令人惊讶,但这是另一个典型现象的例子: 群体智慧。在广泛的应用程序中,发现外行群体能够匹配或超越专家判断的性能。目前的研究表明,即使在错误信息识别的高度两极化的情况下,这种情况也会发生。

实验的参与者还进行了政治知识测试和分析性思维倾向测试。总体而言,对社会问题了解得更多、分析思维更好的人的评分与事实核查人员的评分更为一致。

“参与更多的推理和知识更多的人在事实核查上,和专家表现越一致,”兰德说。“不管他们是民主党人还是共和党人,情况都是如此。”

这一发现可以在很多方面得到应用,一些社交媒体巨头正积极尝试让众包发挥作用。Facebook有一个叫做社区评论的项目,雇佣外行评估新闻内容; 推特有自己的项目,Birdwatch,征求读者对推文真实性的意见。群体智慧可以用来帮助让用户看到的内容包含对应的标签(是否是虚假信息),或者告知排名算法以及人们首先显示的内容。

可以肯定的是,任何使用众包的组织都需要找到一个好的机制来吸引读者参与。如果每个人都能参与,那么众包过程可能会受到特定党派人士的不公平影响。

“我们还没有在一个任何人都可以选择加入的环境中测试该研究的结论是否还成立,”艾伦指出。“平台不一定期望其它众包策略也能产生同样积极的结果。”

另一方面,兰德说,新闻和社会媒体组织必须找到方法,让足够多的人积极评估新闻项目,参与众包工作。

“大多数人并不关心政治,也没有足够的意愿去试图影响社交媒体,”兰德说。“但令人担心的是,如果你让人们给他们想要的任何内容打分,那么只有那些想要玩弄这个系统的人才会这么做。不过,对我来说,比被狂热分子淹没更大的问题是没有人会这么做。这是一个典型的公地悲剧问题: 社会总体上受益于人们识别错误信息,但用户为什么要花费时间和精力给出评级呢?”

参考:

https://news.mit.edu/2021/crowd-source-fact-checking-0901

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/483884.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Cerebras发布全球首个人类大脑规模的AI解决方案

CEREBRAS来源:IEEE电气电子工程师Cerebras Systems公司的CS-2人工智能训练计算机包含了世界上最大的单芯片,该公司透露,在计算机上增加新的存储系统可以提高神经网络的规模,它可以扩大至现有最大模型的100倍,可支持超过…

计算机系统结构 期末复习

一.名词解释 虚拟机:指通过软件模拟具有完整硬件系统功能的,运行在一个完全隔离环境中的完整计算机系统系统加速比:同一个任务在系统改进前花费总时间和在系统改进后花费总时间的比率Amdahl定律:计算计算机系统中某个…

机器学习如何彻底改变游戏中的物理模拟

来源:AI科技评论编译:琰琰编辑:王晔量子力学奠基者之一、英国理论物理学家保罗狄拉克(Paul Dirac)在1929年说过:“大部分物理和化学所需要的数学理论的定律都是已知的,但这些定律的方程太复杂无…

《动手学深度学习 PyTorch版》学习笔记(二):自动求梯度

一、自动求梯度 1、requires_grad_(), detach(), torch.no_grad()的区别 参考博客:https://www.jianshu.com/p/ff74ccae25f3 2、.grad_fn 每个Tensor都有一个.grad_fn属性,该属性即创建该Tensor的Function, 就是说该Tensor是不是通过某些运算得到的&am…

重新认识区块链:1550余个应用案例带来的启示

来源:资本实验室,本文摘自《2021全球区块链应用市场报告》当我们谈论区块链的时候,但凡对区块链有所了解的人都能够就相关主题或多或少地表达出自己的一些见解。例如:从技术体系上看,区块链是分布式数据存储、点对点传…

《动手学深度学习 PyTorch版》学习笔记(三):线性回归

线性回归输出是一个连续值,因此适用于回归问题。回归问题在实际中很常见,如预测房屋价格、气温、销售额等连续值的问题。 一、基本要素 摘自原书 模型定义 设房屋的面积为 x1,房龄为 x2,售出价格为 y。我们需要建立基于输入 x…

OpenAI 是如何被10亿美元收买了“非盈利”灵魂的?

来源:AI科技评论编译:陈彩娴、琰琰近日,一篇名为“How OpenAI Sold its Soul for $1 Billion”(OpenAI是如何因为 10 亿美元出卖自己的灵魂)的文章在 Reddit 上引起了热议。文章作者 Alberto Romero 抨击知名的非营利机…

【算法】蓝桥杯dfs深度优先搜索之排列组合总结

【导航】 上一篇文章 → 《【算法】蓝桥杯dfs深度优先搜索之凑算式总结》 为了重申感谢之意,再次声明下文的大部分灵感均来自于【CSDN】梅森上校《JAVA版本:DFS算法题解两个例子(走迷宫和求排列组合数)》  强烈大家去上面那篇文…

人工神经网络能否驾驭生物神经元的“浓稠”程度?5到8层可能并非极限

来源:图灵人工智能编译:李扬霞编辑:青暮计算神经科学家通过训练人工神经网络来模仿生物神经元,提供了一种探讨单个脑细胞复杂性的新方法。虽然我们糊状的大脑似乎与计算机处理器中的芯片大相径庭,但科学家对两者的比较…

困扰爱因斯坦的「幽灵般的超距作用」,是如何被贝尔定理证明确实存在的?...

文章来源:机器之心作者:Ben Brubaker原文链接:https://www.quantamagazine.org/how-bells-theorem-proved-spooky-action-at-a-distance-is-real-20210720/我们理所当然地认为,世界上某个地方发生的一件事不会立即对远方的事物产生…

Jupyter notebook 导入和卸载 conda 虚拟环境

一、导入 进入Anaconda Prompt,激活要使用的虚拟环境。 conda activate xxx # 你要使用的虚拟环境名称安装 ipykernel 插件, 建议使用 pip 进行安装, conda 安装容易失败 pip install ipykernel安装完成之后,键入以下命令 pyt…

处理器管理与进程管理

4.python练习 1.观察父进程、子进程 2.观察进程运行状态 3。输入多个作业的作业编号,到达时间,所需CPU时间,形成列表,以备算法使用。 转载于:https://www.cnblogs.com/hclhechunlu/p/10580946.html

小白 LeetCode 242 有效的字母异位词

字母异位词 字符串由相同字母组成,但允许排列顺序不同。 如“aaabbb” 与 “ababab” 是字母异位词, 而“aabb” 与 “ab” 不是字母异位词。 题目:给定两个字符串 s 和 t ,编写一个函数来判断 t 是否是 s 的字母异位词。 示例…

LSTM之父:吐槽了两年,来划划重点:“这5篇最高引论文都源于我们。”

来源:AI科技评论作者:陈彩娴编辑:青暮昨晚,“递归神经网络之父”Jrgen Schmidhuber 在推特上亲自发文,称目前引用数最高的5项神经网络工作都基于他的团队成果,一时引起了网友的广泛讨论。这并不是他首次发声…

初学者配置环境变量

1. 首先选择计算机右击,选择最后一个属性,进入属性面板 2. 点击“高级系统设置”,点击“环境变量” 3. 在“系统变量”的处配置所需要配置的环境变量,点击“新建”按钮 4. 配置java的环境变量 JAVA_HOME 、CLASSPATH 、 Path5. JA…

小白 LeetCode 5605 检查两个字符串数据是否相等

题目:给你两个字符串数组 word1 和 word2 。如果两个数组表示的字符串相同,返回 true ;否则,返回 false 。 数组表示的字符串 是由数组中的所有元素 按顺序 连接形成的字符串。 示例 1: 输入:word1 [&q…

Mac OS X下Maven的安装与配置

Mac OS X下Maven的安装与配置: 下载maven:https://maven.apache.org/download.cgi 打开Terminal,输入以下命令,设置Maven classpath,输入命令 vim ~/.bash_profile(编辑环境变量配置文件) MAVEN_HOME/…

演讲实录丨吴朝晖院士:从AI到CI——脑机智能的发展

来源:中国人工智能学会原创 :CAAI作者:吴朝晖院士吴朝晖中国科学院院士浙江大学校长IEEE/CAAI/CCF/CAA Fellow以下是吴朝晖院士的演讲实录:21世纪被称为“脑研究世纪”,伴随着脑科学和认知科学的兴起,特别是…

LeetCode 1480 一维数组的动态和

题目: 给你一个数组 nums 。数组「动态和」的计算公式为:runningSum[i] sum(nums[0]…nums[i]) 。 请返回 nums 的动态和。 示例 1: 输入:nums [1,2,3,4] 输出:[1,3,6,10] 解释:动态和计算过程为 [1,…

推荐系统简介

推荐系统简介 文章目录推荐系统简介1.推荐系统概述推荐系统目的我们推荐的目的:推荐系统的应用推荐系统的基本思想推荐系统的数据分析推荐系统分类2.推荐系统简介基于人口统计学的推荐基于内容的推荐基于协同过滤的推荐混合推荐3.推荐系统评测推荐系统的实验方法推荐…