论文链接:Neutral bots probe political bias on social media | EndNote Click
试图遏制滥用行为和错误信息的社交媒体平台被指责存在政治偏见。我们部署中立的社交机器人,它们开始关注 Twitter 上的不同新闻源,并跟踪它们以探究平台机制与用户交互中出现的明显偏见。我们在新闻推送中没有发现强有力或一致的政治偏见证据。尽管如此,美国 Twitter 用户所接触到的新闻和信息在很大程度上取决于他们早期关系的政治倾向。保守派账户的互动偏右,而自由派账户则接触温和的内容,将他们的经验转向政治中间派。党派账户,尤其是保守账户,往往会获得更多关注者并关注更多自动化账户。保守账户还发现自己处于更密集的社区中,并且接触到更多低可信度的内容。
背景
与传统媒体相比,在线社交媒体可以比以往更便宜、更快捷的方式连接更多的人。由于很大一部分人经常使用社交媒体来生成内容、消费信息以及与他人互动1,在线平台也在塑造用户的规范和行为。
实验表明,简单地改变社交提要上出现的消息就可以影响用户的在线表达和现实世界行为2,3,并且社交媒体用户对早期社会影响很敏感4,5。
研究点引入:两级分化,用户倾向于同质话题;推荐算法倾向于推荐虚假信息,不利于检测
与此同时,社交媒体上的讨论往往围绕选举 6-8、疫苗接种 9 和气候变化 10 等关键但有争议的话题。两极分化往往伴随着观点不一致的用户被隔离到所谓的回声室11-16,即与意识形态激进化和错误信息传播相关的同质在线社区。对抗这种不良现象需要深入了解其根本原因机制。
一方面,网络脆弱性与人类的几种社会认知偏见有关,包括选择与信念一致的信息以及在社会关系中寻求同质性的倾向。
另一方面,网络平台有自己的算法偏差。例如,排名算法偏向流行且引人入胜的内容,这可能会造成恶性循环,放大噪音而不是质量。接触参与度指标也可能会增加受到错误信息影响的可能性。举个更极端的例子,最近的研究和媒体报道表明,无论起点如何,YouTube 推荐系统都可能会导致视频出现更多错误信息或极端观点。
除了个人用户的社会认知偏见和技术平台的算法偏见之外,我们对社交媒体介导的集体互动如何影响我们通过在线信息生态系统获得的世界观的理解非常有限。主要障碍是系统的复杂性——用户不仅通过许多隐藏机制与大量其他人交换大量信息,而且这些交互可以被合法的影响者以及不真实的敌对者公开或秘密地操纵,他们有动机影响观点或激进行为32。有证据表明,社交机器人和网络喷子等恶意实体已经被用来传播错误信息并影响对关键问题的公众舆论33-37。
目标是揭示人们在新闻和信息中接触到的偏见
在这项研究中,我们的目标是揭示人们在新闻和信息中接触到的偏见。社交媒体生态系统。我们特别有兴趣澄清社交媒体互动在极化过程和回声室形成过程中的作用。因此,我们关注 Twitter 上的美国政治话语,因为该平台在美国政治中发挥着重要作用,并且存在强烈的两极分化和回音室现象。 Twitter 形成了一个有向社交网络,其中从朋友节点到关注者节点的边表示该朋友发布的内容出现在关注者的新闻提要上。
我们的目标是研究生态系统偏见,其中包括潜在的平台偏见以及与社交网络(有机或非有机)用户互动的净效应,这些效应由平台机制介导并受其政策监管。虽然我们只尝试在提要管理的狭隘情况下将平台效应与自然发生的偏差分开,但我们的调查针对的是平台用户所经历的整体偏差。这需要排除个人用户的偏见,这是使用传统观察方法时的一个挑战——不可能将生态系统影响与可能影响被跟踪人类账户行为的混杂因素分开,例如年龄、性别、种族、意识形态和社会经济的。
完全由算法控制的社交媒体帐户(称为社交机器人)
因此,我们转向一种方法,通过利用模仿人类用户但完全由算法控制的社交媒体帐户(称为社交机器人)来消除控制此类混杂因素的需要。在这里,我们部署具有中立(无偏见)和随机行为的社交机器人作为探测社交媒体中曝光偏差的工具。我们将我们的机器人称为“漂流者”,以将它们的中立行为与 Twitter上其他类型的良性和恶意社交机器人区分开来。所有漂流者都有相同的行为模型,唯一的区别是最初的朋友不同。
在我们的实验中,在代表单个自变量(治疗)的初始行动之后,每个漂流者都被释放到野外。可以肯定的是,虽然所有的漂流者都有相同的行为,但是他们的行为是不同的,取决于他们的初始条件。我们预计,最初关注自由主义账户的漂泊者将更有可能接触自由主义内容,分享其中一些内容,被自由主义账户关注,等等。但这些行为是由平台机制和社会互动驱动的,而不是由自变量中的政治偏见驱动的:行为模型无法区分自由派、保守派或任何类型的内容。因此,漂流者的行为是我们实验测量的因变量(结果)的一部分。
研究问题
这种方法使我们能够检查源自 Twitter 系统设计和算法以及漂流者和其他帐户之间有机和无机社交互动的综合偏差。我们的研究问题是:(i)社交媒体平台上的早期行为对不真实账户、政治回声室和错误信息的影响和曝光有何影响?
(ii) 这种差异是否可以归因于平台新闻源中的政治偏见?为了回答这些问题,我们初始化了来自不同政治领域新闻来源的漂移者。
五个月后,我们检查了漂流者消费和生成的内容,并分析了(i)他们的朋友和追随者的特征,包括通过共享链接和主题标签推断出他们的自由保守派政治立场;
(ii) 通过机器学习方法测量的自动化活动;
(iii) 接触来自新闻和事实核查组织确定的低可信度来源的信息。
我们发现最初朋友的政治立场对受欢迎程度、社交网络结构、接触机器人和低可信度来源以及每个漂泊者的行为所体现的政治立场有重大影响。然而,我们没有发现任何证据表明这些结果可以归因于平台偏见。我们对 Twitter 信息生态系统政治趋势的研究提供的见解可以帮助公众辩论社交媒体平台如何影响人们对政治信息的接触。
结果
我们实验中的所有漂流者都遵循相同的行为模型,其设计是中立的,不一定是现实的。每个漂流者在随机时间被激活以执行操作。操作类型,例如推文、点赞和回复是根据以下条件随机选择的:预定义的概率。对于每个操作,模型指定如何选择随机目标,例如要转发的推文或要取消关注的好友。动作之间的时间间隔是从广泛的分布中得出的,以产生逼真的突发行为。
漂流机器人的实施
详细信息请参见“方法”。我们开发了 15 个漂流机器人,将它们分为五组,并使用相同的初始朋友初始化同一组中的每个漂流机器人。每个 Twitter 帐户都使用与美国政治光谱的左派、中左派、中间派、中右派或右派一致的流行新闻来源作为第一个朋友(详细信息请参阅“方法”)。我们用他们最初朋友的政治立场来称呼漂流者。例如,使用中左来源初始化的机器人被称为“C.左”漂流者。
从2019年7月10日部署到2019年12月1日停用,我们每天监控漂流者的行为并收集数据。具体来说,我们测量了:(1)每个漂流者的追随者数量,以比较他们获得影响力的能力; (2) 每个漂流者的回波室暴露情况; (3) 漂流者的朋友和追随者可能进行的自动化活动; (4)漂流者接触到的低可信度信息比例; (5) 对漂流者及其朋友生成的内容进行政治调整,以探究政治偏见。
影响力。追随者的数量可以用作影响力的粗略指标。为了衡量政治联盟如何影响影响力动态,图 1 绘制了不同群体中漂流者随时间变化的平均追随者数量。
(图1追随者的增长。X 轴显示的是2019年实验的持续时间,而 x 轴显示的是不同流浪者群体的平均追随者数量。有色置信区间表示 ± 1标准误差。源数据以源数据文件的形式提供。自然通讯 | https://doi.org/10.1038/s41467-021-25738-6articlenature 通讯 | (2021)12:5580 | https://doi.org/10.1038/s41467-021-25738-6 | www.nature.com/naturecommunications3)
为了比较不同组的增长率,我们考虑了对每个漂流者的追随者计数的连续观察,并将它们在每个组中汇总(n = 387 为左,373 为 C. 左,389 为中,387 为 C. 右,386 为右)。 测试中出现了两种趋势(本次分析和以下分析中的所有测试都是双面的)。
首先,与大多数党派来源作为初始朋友的漂流者往往比中间漂流者吸引更多的追随者(左派与中派的d.f.=774,t=5.13,p<0.001,右派d.f.=773,t=8.00,p<0.001)与中心)。其次,初始来源右倾的漂流者获得追随者的比例明显高于初始来源左倾的漂流者(d.f=771,t=3.84,右翼与左翼的 p< 0.001)。
漂流者之间影响力的差异不仅受到政治结盟的影响,还受到他们最初朋友的其他特征的影响。为了理清这些因素,我们测量了漂泊者追随者的数量与他们最初朋友的两个特征之间的相关性:他们的整体影响力和他们在其他政治联盟账户中的受欢迎程度。虽然漂流者的影响力不受最初朋友的整体影响力的影响,但它与他们在政治上一致的账户中的受欢迎程度呈正相关(见补充说明)。这与具有共同党派倾向的用户更有可能形成社会关系的证据一致42,正如我们接下来探讨的那样。
回声室。
我们将回声室定义为密集且高度聚集的社交媒体社区,可以放大同质内容的曝光度。为了研究漂流者机器人是否发现自己处于这样的回声室中,让我们考虑每个漂流者的自我网络,即由漂流者及其朋友和追随者组成的网络。我们可以使用自我网络的密度和传递性作为回声室存在的代理。密度是网络中连接的节点对的分数。传递性衡量节点中实际存在的可能三角形的比例。高传递性意味着朋友和关注者也可能互相关注。详细内容请参见“方法”。
图2a、b显示了漂流者自我网络的平均密度和传递性(详见“方法”)。由于这两个度量在自我网络中是相关的,图 2c 还绘制了通过打乱的随机网络重新调整的传递性(参见“方法”)。
(图2 漂流器周围的回波室结构。不同群体漂泊者自我网络的a密度、b及物性及标准化及物性。误差条表示标准误差(每组 n=3 名漂流者)。d 五个组中漂流者的自我网络。节点代表帐户,边代表朋友/关注者关系。节点大小和颜色分别表示共享链接的程度(邻居数量)和政治倾向。由于不共享政治内容,黑色节点缺少对齐分数。源数据作为源数据文件提供。 3 漂流者的朋友和追随者的机器人分数分布。机器人分数是 0 到 1 之间的数字,分数越高表示可能是自动化的。对于每个组,我们考虑该组中漂流者的朋友和追随者的联合。条形表示平均值。对于朋友,n=282(左)、261(左)、206(中)、323(右)和 414(右)。对于追随者,n=172(左)、118(左)、65(中)、205(右)和 299(右)。源数据作为源数据文件提供。 https://doi.org/10.1038/s41467-021-25738-64自然通讯| (2021) 12:5580 | https://doi.org/10.1038/s41467-021-25738-6 | www.nature.com/naturecommunications)
右漂者的自我网络比中漂者的自我网络更密集(d.f.=4,t=−8.28,p=0.001),而中漂者和左漂者之间的密度差异并不显着(d.f.=4,t=−2.68,p =0.055)。右帐户网络也比中心网络具有更高的传递性(d.f.=4,t=−9.31,p<0.001);左帐户网络也具有更高的传递性(d.f.=4,t=−3.53,p=0.024)。即使考虑到密度差异 (d.f.=4,t=−8.96,p< 0.001),右翼账户也比中间派账户更加聚集,而左翼账户与中间账户的差异并不显着 (d.f.=4,t=−2.73,p =0.053)。此外,右漂移器的回声室比左漂移器更强(对于密度,d.f.=4,t=−3.84,p=0.019;对于传递性,d.f.=4,t=−3.02,p=0.039)。然而,左、右之间归一化及物性的差异并不显着(d.f.=4,t=−0.60,p=0.579),这表明右侧较高的聚集性是由社会联系的密度来解释的。
自动化活动。
被称为社交机器人的自动化账户积极参与有关最近美国选举的在线讨论33,43,44。因此,漂流者预计会遇到机器人帐户。我们使用 Botometer 服务45,46 收集漂流者的朋友和关注者的机器人分数。我们在图 3 中报告了漂流者的朋友和追随者的机器人分数分布。毫不奇怪,跨政治领域的漂流者更有可能在他们的追随者中拥有机器人,而不是在他们的朋友中。关注朋友揭示了社交媒体用户更严重的潜在脆弱性。我们发现,党派漂流者关注的账户比中间派漂流者关注的账户更像机器人(d.f.=618,t=−6.14,p<0.001(右翼 vs. 中间)和 d.f.=486,t=−3.67,p<0.001(左翼 vs. 中间)中心)。比较党派和温和派,右翼漂流者所遵循的账户比C.右翼漂流者更像机器人(d.f.=735,t=−3.01,p=0.003),而自由派的差异较小(d.f.=541,t=− 2.56,p=0.011(左与 C. 左)。在党派中,右翼分子关注的账户比左翼账户更像机器人(d.f.=694,t=−2.33,p=0.020)。