利用群体智慧,进行大规模的事实审核

来源:混沌巡洋舰

为了应对虚假信息,社交媒体网络和新闻机构经常雇佣事实核查员来区分真假。但事实核查人员只能评估网上流传的一小部分故事。麻省理工学院研究人员的一项新研究提出了另一种方法: 研究指出来自普通读者群体的众包准确性判断,实际上可以和专业事实核查人员的工作一样有效。

“事实核查的一个问题是,对于专业的事实核查人员来说,有太多的内容无法覆盖,尤其是在合理的时间范围内,”Jennifer Allen 说,她是 MIT斯隆管理学院的一名博士生,也是最近在科学进展发表的题为“利用群体智慧扩大事实核查”的论文的合著者。

论文地址:

https://www.science.org/doi/10.1126/sciadv.abf4393

该研究检查了超过200篇Facebook 算法已经标记为需要进一步审查的新闻报道,通过使用相对较小的、政治上平衡的外行读者群体,可评估新闻报道的标题和导语。

“我们发现这令人鼓舞,”Allen表示。“10至15人的平均评分与专业事实核查员的判断相关,而外行事实核查员的判断,相互之间也是相关的。这有助于解决可扩展性问题,因为这些评级员都是普通人,没有经过事实核查培训,他们只是阅读标题和引导句子,没有花时间做任何研究。”这意味着这种众包方式可以广泛应用,而且成本低廉。这项研究估计,让读者以这种方式评估新闻的成本大约是每篇报道0.9美元。

麻省理工学院斯隆管理学院的David Rand教授是这项研究的通讯作者之一,他说: “没有一种方法可以解决网络虚假新闻的问题。但我们正在努力为对抗虚假信息的工具箱中,增加有希望的方法。”

为了进行这项研究,研究人员使用了207篇新闻文章。Facebook 内部的算法认定,这些文章需要进行事实核查,要么是因为有理由相信它们的内容有问题,要么仅仅是因为它们被广泛分享,或者与健康等重要话题有关。该实验使用亚马逊的 Mechanical Turk 平台,征集了1128名美国居民。

研究人员向这些参与者发放了20篇新闻报道的标题和引言,并向他们提出了7个问题ーー这些报道在多大程度上是“准确的”、“真实的”、“可靠的”、“可信赖的”、“客观的”、“没有偏见的”和“描述实际发生的事件”ーー以便为每个新闻项目产生一个总体的准确性评分。

多少个普通人对新闻可靠性的评分(横轴)与专家评分一致性的相关系数,红点代表能看到原文,绿点代表只可看到标题和摘要,上图是全部内容,下面按照新闻是否和政治相关,分为两类

与此同时,三名专业的事实核查人员被要求对所有207篇报道进行调查后的评估。与其他关于事实核查的研究一致,尽管事实核查者的评分彼此高度相关,但他们的一致性远非完美。在大约49% 的案例中,三名事实核查人员对一个故事的真实性都做出了合理的判断; 在大约42% 的案例中,三名事实核查人员中的两人表示同意; 在大约9% 的案例中,三名事实核查人员的评分各不相同。

有趣的是,当研究招募的常规读者被分成民主党人和共和党人数相同的组时,他们的平均评分与专业事实核查者的评分高度相关,而且至少有两位数的读者参与,人群的评分与事实核查者之间的相关性就像事实核查者之间的相关性一样强。

“这些读者没有接受过事实核查方面的培训,他们只是阅读标题和引言句,即便如此,他们也能够与事实核查员的表现相匹配,”艾伦说。

一开始,12到20名读者的表现能与专业的事实核查员相媲美,这似乎令人惊讶,但这是另一个典型现象的例子: 群体智慧。在广泛的应用程序中,发现外行群体能够匹配或超越专家判断的性能。目前的研究表明,即使在错误信息识别的高度两极化的情况下,这种情况也会发生。

实验的参与者还进行了政治知识测试和分析性思维倾向测试。总体而言,对社会问题了解得更多、分析思维更好的人的评分与事实核查人员的评分更为一致。

“参与更多的推理和知识更多的人在事实核查上,和专家表现越一致,”兰德说。“不管他们是民主党人还是共和党人,情况都是如此。”

这一发现可以在很多方面得到应用,一些社交媒体巨头正积极尝试让众包发挥作用。Facebook有一个叫做社区评论的项目,雇佣外行评估新闻内容; 推特有自己的项目,Birdwatch,征求读者对推文真实性的意见。群体智慧可以用来帮助让用户看到的内容包含对应的标签(是否是虚假信息),或者告知排名算法以及人们首先显示的内容。

可以肯定的是,任何使用众包的组织都需要找到一个好的机制来吸引读者参与。如果每个人都能参与,那么众包过程可能会受到特定党派人士的不公平影响。

“我们还没有在一个任何人都可以选择加入的环境中测试该研究的结论是否还成立,”艾伦指出。“平台不一定期望其它众包策略也能产生同样积极的结果。”

另一方面,兰德说,新闻和社会媒体组织必须找到方法,让足够多的人积极评估新闻项目,参与众包工作。

“大多数人并不关心政治,也没有足够的意愿去试图影响社交媒体,”兰德说。“但令人担心的是,如果你让人们给他们想要的任何内容打分,那么只有那些想要玩弄这个系统的人才会这么做。不过,对我来说,比被狂热分子淹没更大的问题是没有人会这么做。这是一个典型的公地悲剧问题: 社会总体上受益于人们识别错误信息,但用户为什么要花费时间和精力给出评级呢?”

参考:

https://news.mit.edu/2021/crowd-source-fact-checking-0901

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/483884.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

torch.randn与torch.rand的区别

randn torch.randn(*sizes, outNone) → Tensor返回一个包含了从标准正态分布中抽取的一组随机数的张量 size:张量的形状 out:结果张量 rand torch.rand(*sizes, outNone) → Tensor[0,1)之间的均匀分布

xsi:schemaLocation=http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd报...

https://blog.csdn.net/qq_36611526/article/details/79067159 今天遇到个问题 文件内引入某个资源 pom.xml头部http://maven.apache.org/xsd/maven-4.0.0.xsd"报错。 后来各种百度发现是包的问题: 1、找到maven的包的位置:window->preferences-…

解决git关联的的文件颜色、小图标

按WinR键打开运行对话框,输入 regedit.exe ,准备修改注册表找到 HKEY_LOCAL_MACHINE\Software\Microsoft\Windows\CurrentVersion\Explorer;新建一个键名称为 “Max Cached Icons” 数据设置为 “2000”;重启一下电脑,…

Cerebras发布全球首个人类大脑规模的AI解决方案

CEREBRAS来源:IEEE电气电子工程师Cerebras Systems公司的CS-2人工智能训练计算机包含了世界上最大的单芯片,该公司透露,在计算机上增加新的存储系统可以提高神经网络的规模,它可以扩大至现有最大模型的100倍,可支持超过…

《动手学深度学习 PyTorch版》学习笔记(一):数据操作

一、数据操作 在PyTorch中,torch.Tensor是存储和变换数据的主要工具。 "tensor"这个单词一般可译作“张量”,张量可以看作是一个多维数组。 标量可以看作是0维张量,向量可以看作1维张量,矩阵可以看作是二维张量。1、t…

计算机系统结构 期末复习

一.名词解释 虚拟机:指通过软件模拟具有完整硬件系统功能的,运行在一个完全隔离环境中的完整计算机系统系统加速比:同一个任务在系统改进前花费总时间和在系统改进后花费总时间的比率Amdahl定律:计算计算机系统中某个…

Redis数据持久化、数据备份、数据的故障恢复

1.redis持久化的意义----redis故障恢复   在实际的生产环境中,很可能会遇到redis突然挂掉的情况,比如redis的进程死掉了、电缆被施工队挖了(支付宝例子)等等,总之一定会遇到各种奇葩的现象导致redis死掉,…

机器学习如何彻底改变游戏中的物理模拟

来源:AI科技评论编译:琰琰编辑:王晔量子力学奠基者之一、英国理论物理学家保罗狄拉克(Paul Dirac)在1929年说过:“大部分物理和化学所需要的数学理论的定律都是已知的,但这些定律的方程太复杂无…

《动手学深度学习 PyTorch版》学习笔记(二):自动求梯度

一、自动求梯度 1、requires_grad_(), detach(), torch.no_grad()的区别 参考博客:https://www.jianshu.com/p/ff74ccae25f3 2、.grad_fn 每个Tensor都有一个.grad_fn属性,该属性即创建该Tensor的Function, 就是说该Tensor是不是通过某些运算得到的&am…

学习计划1

今天开始着手做热词的项目,但是对于数据的处理仍然没有好的办法,网上最多的方法便是用C#操作,但是在尝试之后仍然没有进展转载于:https://www.cnblogs.com/ljysy/p/10574018.html

线性表——顺序表

1 算法思想:顺序遍历整个链表,找出最小值元素,用一个min存储这个值,同时将最后一个元素填补此值#define Maxsize 100 typedef Elemtype int typedef struct{Elemtype data[Maxsize];int length; }bool delmin(sqlist &L,Elem…

重新认识区块链:1550余个应用案例带来的启示

来源:资本实验室,本文摘自《2021全球区块链应用市场报告》当我们谈论区块链的时候,但凡对区块链有所了解的人都能够就相关主题或多或少地表达出自己的一些见解。例如:从技术体系上看,区块链是分布式数据存储、点对点传…

线性表——链表

#include <iostream> #include <bits/stdc.h> using namespace std;typedef int Elemtype; //定义单链表 typedef struct Lnode{Elemtype data;struct Lnode *next; }Lnode,*Linklist; int a[4]{1,2,3,4}; int n4;//建立不带头节点的链表 void buildlist(Lnode *L)…

《动手学深度学习 PyTorch版》学习笔记(三):线性回归

线性回归输出是一个连续值&#xff0c;因此适用于回归问题。回归问题在实际中很常见&#xff0c;如预测房屋价格、气温、销售额等连续值的问题。 一、基本要素 摘自原书 模型定义 设房屋的面积为 x1&#xff0c;房龄为 x2&#xff0c;售出价格为 y。我们需要建立基于输入 x…

php 实现图片上传并压缩功能

前段时间由于项目需要&#xff0c;要实现图片上传并且压缩生成缩略图的功能。 接口代码如下&#xff1a; $allowext array ( png, jpg, jpeg, gif,mp4,doc); $fileElement file; $filepath_rel userfiles/upload/chatfile/.date("Ymd")."/"; // 相对路径…

OpenAI 是如何被10亿美元收买了“非盈利”灵魂的?

来源&#xff1a;AI科技评论编译&#xff1a;陈彩娴、琰琰近日&#xff0c;一篇名为“How OpenAI Sold its Soul for $1 Billion”&#xff08;OpenAI是如何因为 10 亿美元出卖自己的灵魂&#xff09;的文章在 Reddit 上引起了热议。文章作者 Alberto Romero 抨击知名的非营利机…

传输速率、波特率、奈氏准则

波特率与传输速率 波特率与数据传输速率C的关系&#xff1a;CBlog2N N:为一个码元所取的离散值的个数。 408考研-2011-34 若某通信链路的数据传输速率为2400bps&#xff0c;采用四相位调制&#xff0c;则该链路的波特率是_____。 A.600波特 B.1200波特 C.4800波特 D.9600波特…

【算法】蓝桥杯dfs深度优先搜索之排列组合总结

【导航】 上一篇文章 → 《【算法】蓝桥杯dfs深度优先搜索之凑算式总结》 为了重申感谢之意&#xff0c;再次声明下文的大部分灵感均来自于【CSDN】梅森上校《JAVA版本&#xff1a;DFS算法题解两个例子&#xff08;走迷宫和求排列组合数&#xff09;》  强烈大家去上面那篇文…

人工神经网络能否驾驭生物神经元的“浓稠”程度?5到8层可能并非极限

来源&#xff1a;图灵人工智能编译&#xff1a;李扬霞编辑&#xff1a;青暮计算神经科学家通过训练人工神经网络来模仿生物神经元&#xff0c;提供了一种探讨单个脑细胞复杂性的新方法。虽然我们糊状的大脑似乎与计算机处理器中的芯片大相径庭&#xff0c;但科学家对两者的比较…

leaf 叶子(张量)

在pytorch的tensor类中,有个is_leaf的属性,姑且把它作为叶子节点. is_leaf 为False的时候,则不是叶子节点, is_leaf为True的时候为叶子节点(或者叶张量) 所以问题来了: leaf的作用是什么?为什么要加 leaf? 我们都知道tensor中的 requires_grad()属性&#xff0c;当requires_…