论文阅读 - Neutral bots probe political bias on social media

论文链接:Neutral bots probe political bias on social media | EndNote Click

        试图遏制滥用行为和错误信息的社交媒体平台被指责存在政治偏见。我们部署中立的社交机器人,它们开始关注 Twitter 上的不同新闻源,并跟踪它们以探究平台机制与用户交互中出现的明显偏见。我们在新闻推送中没有发现强有力或一致的政治偏见证据。尽管如此,美国 Twitter 用户所接触到的新闻和信息在很大程度上取决于他们早期关系的政治倾向。保守派账户的互动偏右,而自由派账户则接触温和的内容,将他们的经验转向政治中间派。党派账户,尤其是保守账户,往往会获得更多关注者并关注更多自动化账户。保守账户还发现自己处于更密集的社区中,并且接触到更多低可信度的内容。

背景

        与传统媒体相比,在线社交媒体可以比以往更便宜、更快捷的方式连接更多的人。由于很大一部分人经常使用社交媒体来生成内容、消费信息以及与他人互动1,在线平台也在塑造用户的规范和行为。

        实验表明,简单地改变社交提要上出现的消息就可以影响用户的在线表达和现实世界行为2,3,并且社交媒体用户对早期社会影响很敏感4,5。

研究点引入:两级分化,用户倾向于同质话题;推荐算法倾向于推荐虚假信息,不利于检测

        与此同时,社交媒体上的讨论往往围绕选举 6-8、疫苗接种 9 和气候变化 10 等关键但有争议的话题。两极分化往往伴随着观点不一致的用户被隔离到所谓的回声室11-16,即与意识形态激进化和错误信息传播相关的同质在线社区。对抗这种不良现象需要深入了解其根本原因机制。

        一方面,网络脆弱性与人类的几种社会认知偏见有关,包括选择与信念一致的信息以及在社会关系中寻求同质性的倾向。

        另一方面,网络平台有自己的算法偏差。例如,排名算法偏向流行且引人入胜的内容,这可能会造成恶性循环,放大噪音而不是质量。接触参与度指标也可能会增加受到错误信息影响的可能性。举个更极端的例子,最近的研究和媒体报道表明,无论起点如何,YouTube 推荐系统都可能会导致视频出现更多错误信息或极端观点。

        除了个人用户的社会认知偏见和技术平台的算法偏见之外,我们对社交媒体介导的集体互动如何影响我们通过在线信息生态系统获得的世界观的理解非常有限。主要障碍是系统的复杂性——用户不仅通过许多隐藏机制与大量其他人交换大量信息,而且这些交互可以被合法的影响者以及不真实的敌对者公开或秘密地操纵,他们有动机影响观点或激进行为32。有证据表明,社交机器人和网络喷子等恶意实体已经被用来传播错误信息并影响对关键问题的公众舆论33-37。

目标是揭示人们在新闻和信息中接触到的偏见

        在这项研究中,我们的目标是揭示人们在新闻和信息中接触到的偏见。社交媒体生态系统。我们特别有兴趣澄清社交媒体互动在极化过程和回声室形成过程中的作用。因此,我们关注 Twitter 上的美国政治话语,因为该平台在美国政治中发挥着重要作用,并且存在强烈的两极分化和回音室现象。 Twitter 形成了一个有向社交网络,其中从朋友节点到关注者节点的边表示该朋友发布的内容出现在关注者的新闻提要上。

        我们的目标是研究生态系统偏见,其中包括潜在的平台偏见以及与社交网络(有机或非有机)用户互动的净效应,这些效应由平台机制介导并受其政策监管。虽然我们只尝试在提要管理的狭隘情况下将平台效应与自然发生的偏差分开,但我们的调查针对的是平台用户所经历的整体偏差。这需要排除个人用户的偏见,这是使用传统观察方法时的一个挑战——不可能将生态系统影响与可能影响被跟踪人类账户行为的混杂因素分开,例如年龄、性别、种族、意识形态和社会经济的。

完全由算法控制的社交媒体帐户(称为社交机器人)

        因此,我们转向一种方法,通过利用模仿人类用户但完全由算法控制的社交媒体帐户(称为社交机器人)来消除控制此类混杂因素的需要。在这里,我们部署具有中立(无偏见)和随机行为的社交机器人作为探测社交媒体中曝光偏差的工具。我们将我们的机器人称为“漂流者”,以将它们的中立行为与 Twitter上其他类型的良性和恶意社交机器人区分开来。所有漂流者都有相同的行为模型,唯一的区别是最初的朋友不同。

        在我们的实验中,在代表单个自变量(治疗)的初始行动之后,每个漂流者都被释放到野外。可以肯定的是,虽然所有的漂流者都有相同的行为,但是他们的行为是不同的,取决于他们的初始条件。我们预计,最初关注自由主义账户的漂泊者将更有可能接触自由主义内容,分享其中一些内容,被自由主义账户关注,等等。但这些行为是由平台机制和社会互动驱动的,而不是由自变量中的政治偏见驱动的:行为模型无法区分自由派、保守派或任何类型的内容。因此,漂流者的行为是我们实验测量的因变量(结果)的一部分。

研究问题

        这种方法使我们能够检查源自 Twitter 系统设计和算法以及漂流者和其他帐户之间有机和无机社交互动的综合偏差。我们的研究问题是:(i)社交媒体平台上的早期行为对不真实账户、政治回声室和错误信息的影响和曝光有何影响?

        (ii) 这种差异是否可以归因于平台新闻源中的政治偏见?为了回答这些问题,我们初始化了来自不同政治领域新闻来源的漂移者。

        五个月后,我们检查了漂流者消费和生成的内容,并分析了(i)他们的朋友和追随者的特征,包括通过共享链接和主题标签推断出他们的自由保守派政治立场;

         (ii) 通过机器学习方法测量的自动化活动

         (iii) 接触来自新闻和事实核查组织确定的低可信度来源的信息。

        我们发现最初朋友的政治立场对受欢迎程度、社交网络结构、接触机器人和低可信度来源以及每个漂泊者的行为所体现的政治立场有重大影响。然而,我们没有发现任何证据表明这些结果可以归因于平台偏见。我们对 Twitter 信息生态系统政治趋势的研究提供的见解可以帮助公众辩论社交媒体平台如何影响人们对政治信息的接触。

结果

        我们实验中的所有漂流者都遵循相同的行为模型,其设计是中立的,不一定是现实的。每个漂流者在随机时间被激活以执行操作。操作类型,例如推文、点赞和回复是根据以下条件随机选择的:预定义的概率。对于每个操作,模型指定如何选择随机目标,例如要转发的推文或要取消关注的好友。动作之间的时间间隔是从广泛的分布中得出的,以产生逼真的突发行为。

漂流机器人的实施

        详细信息请参见“方法”。我们开发了 15 个漂流机器人,将它们分为五组,并使用相同的初始朋友初始化同一组中的每个漂流机器人。每个 Twitter 帐户都使用与美国政治光谱的左派、中左派、中间派、中右派或右派一致的流行新闻来源作为第一个朋友(详细信息请参阅“方法”)。我们用他们最初朋友的政治立场来称呼漂流者。例如,使用中左来源初始化的机器人被称为“C.左”漂流者。

        从2019年7月10日部署到2019年12月1日停用,我们每天监控漂流者的行为并收集数据。具体来说,我们测量了:(1)每个漂流者的追随者数量,以比较他们获得影响力的能力; (2) 每个漂流者的回波室暴露情况; (3) 漂流者的朋友和追随者可能进行的自动化活动; (4)漂流者接触到的低可信度信息比例; (5) 对漂流者及其朋友生成的内容进行政治调整,以探究政治偏见。

        影响力。追随者的数量可以用作影响力的粗略指标。为了衡量政治联盟如何影响影响力动态,图 1 绘制了不同群体中漂流者随时间变化的平均追随者数量。

 (图1追随者的增长。X 轴显示的是2019年实验的持续时间,而 x 轴显示的是不同流浪者群体的平均追随者数量。有色置信区间表示 ± 1标准误差。源数据以源数据文件的形式提供。自然通讯 |  https://doi.org/10.1038/s41467-021-25738-6articlenature 通讯 | (2021)12:5580 |  https://doi.org/10.1038/s41467-021-25738-6 |  www.nature.com/naturecommunications3)

        为了比较不同组的增长率,我们考虑了对每个漂流者的追随者计数的连续观察,并将它们在每个组中汇总(n = 387 为左,373 为 C. 左,389 为中,387 为 C. 右,386 为右)。 测试中出现了两种趋势(本次分析和以下分析中的所有测试都是双面的)。

        首先,与大多数党派来源作为初始朋友的漂流者往往比中间漂流者吸引更多的追随者(左派与中派的d.f.=774,t=5.13,p<0.001,右派d.f.=773,t=8.00,p<0.001)与中心)。其次,初始来源右倾的漂流者获得追随者的比例明显高于初始来源左倾的漂流者(d.f=771,t=3.84,右翼与左翼的 p< 0.001)。

        漂流者之间影响力的差异不仅受到政治结盟的影响,还受到他们最初朋友的其他特征的影响。为了理清这些因素,我们测量了漂泊者追随者的数量与他们最初朋友的两个特征之间的相关性:他们的整体影响力和他们在其他政治联盟账户中的受欢迎程度。虽然漂流者的影响力不受最初朋友的整体影响力的影响,但它与他们在政治上一致的账户中的受欢迎程度呈正相关(见补充说明)。这与具有共同党派倾向的用户更有可能形成社会关系的证据一致42,正如我们接下来探讨的那样。

        回声室。

        我们将回声室定义为密集且高度聚集的社交媒体社区,可以放大同质内容的曝光度。为了研究漂流者机器人是否发现自己处于这样的回声室中,让我们考虑每个漂流者的自我网络,即由漂流者及其朋友和追随者组成的网络。我们可以使用自我网络的密度和传递性作为回声室存在的代理。密度是网络中连接的节点对的分数。传递性衡量节点中实际存在的可能三角形的比例。高传递性意味着朋友和关注者也可能互相关注。详细内容请参见“方法”。

        图2a、b显示了漂流者自我网络的平均密度和传递性(详见“方法”)。由于这两个度量在自我网络中是相关的,图 2c 还绘制了通过打乱的随机网络重新调整的传递性(参见“方法”)。

 (图2 漂流器周围的回波室结构。不同群体漂泊者自我网络的a密度、b及物性及标准化及物性。误差条表示标准误差(每组 n=3 名漂流者)。d 五个组中漂流者的自我网络。节点代表帐户,边代表朋友/关注者关系。节点大小和颜色分别表示共享链接的程度(邻居数量)和政治倾向。由于不共享政治内容,黑色节点缺少对齐分数。源数据作为源数据文件提供。 3 漂流者的朋友和追随者的机器人分数分布。机器人分数是 0 到 1 之间的数字,分数越高表示可能是自动化的。对于每个组,我们考虑该组中漂流者的朋友和追随者的联合。条形表示平均值。对于朋友,n=282(左)、261(左)、206(中)、323(右)和 414(右)。对于追随者,n=172(左)、118(左)、65(中)、205(右)和 299(右)。源数据作为源数据文件提供。 https://doi.org/10.1038/s41467-021-25738-64自然通讯| (2021) 12:5580 | https://doi.org/10.1038/s41467-021-25738-6 | www.nature.com/naturecommunications)

        右漂者的自我网络比中漂者的自我网络更密集(d.f.=4,t=−8.28,p=0.001),而中漂者和左漂者之间的密度差异并不显着(d.f.=4,t=−2.68,p =0.055)。右帐户网络也比中心网络具有更高的传递性(d.f.=4,t=−9.31,p<0.001);左帐户网络也具有更高的传递性(d.f.=4,t=−3.53,p=0.024)。即使考虑到密度差异 (d.f.=4,t=−8.96,p< 0.001),右翼账户也比中间派账户更加聚集,而左翼账户与中间账户的差异并不显着 (d.f.=4,t=−2.73,p =0.053)。此外,右漂移器的回声室比左漂移器更强(对于密度,d.f.=4,t=−3.84,p=0.019;对于传递性,d.f.=4,t=−3.02,p=0.039)。然而,左、右之间归一化及物性的差异并不显着(d.f.=4,t=−0.60,p=0.579),这表明右侧较高的聚集性是由社会联系的密度来解释的。

        自动化活动。

        被称为社交机器人的自动化账户积极参与有关最近美国选举的在线讨论33,43,44。因此,漂流者预计会遇到机器人帐户。我们使用 Botometer 服务45,46 收集漂流者的朋友和关注者的机器人分数。我们在图 3 中报告了漂流者的朋友和追随者的机器人分数分布。毫不奇怪,跨政治领域的漂流者更有可能在他们的追随者中拥有机器人,而不是在他们的朋友中。关注朋友揭示了社交媒体用户更严重的潜在脆弱性。我们发现,党派漂流者关注的账户比中间派漂流者关注的账户更像机器人(d.f.=618,t=−6.14,p<0.001(右翼 vs. 中间)和 d.f.=486,t=−3.67,p<0.001(左翼 vs. 中间)中心)。比较党派和温和派,右翼漂流者所遵循的账户比C.右翼漂流者更像机器人(d.f.=735,t=−3.01,p=0.003),而自由派的差异较小(d.f.=541,t=− 2.56,p=0.011(左与 C. 左)。在党派中,右翼分子关注的账户比左翼账户更像机器人(d.f.=694,t=−2.33,p=0.020)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/35345.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

超导热催生meme,换汤不换药的投机轮回

文/章鱼哥 出品/陀螺财经 币圈对炒作meme概念的热情从未消亡过。 随着一种名为LK-99的物质被发现&#xff0c;围绕超导的兴奋不仅激发了科学界&#xff0c;加密货币相关概念也与之沸腾。不出所料&#xff0c;与此前围绕元宇宙、AI大肆炒作一样&#xff0c;许多meme代币已经出现…

关于MySQL中的binlog

介绍 undo log 和 redo log是由Inno DB存储引擎生成的。 在MySQL服务器架构中&#xff0c;分为三层&#xff1a;连接层、服务层&#xff08;server层&#xff09;、执行层&#xff08;存储引擎层&#xff09; bin log 是 binary log的缩写&#xff0c;即二进制日志。 MySQL…

android开发之Android 自定义滑动解锁View

自定义滑动解锁View 需求如下&#xff1a; 近期需要做一个类似屏幕滑动解锁的功能&#xff0c;右划开始&#xff0c;左划暂停。 需求效果图如下 实现效果展示 自定义view如下 /** Desc 自定义滑动解锁View Author ZY Mail sunnyfor98gmail.com Date 2021/5/17 11:52 *…

数据结构——线性表

文章目录 线性表的定义和基本操作顺序表线性表的链式表示 线性表的定义和基本操作 线性表是具有相同数据类型的(n≥0)个数据元素的有限序列&#xff0c;其中n为表长&#xff0c;当n0时线性表是一个空表。若用L命名线性表&#xff0c;则其中一般表示为&#xff1a;L(a1,a2,a3, …

CCLINK转MODBUS-TCP网关cclink通讯接线图 终端电阻

大家好&#xff0c;今天我们要聊的是生产管理系统中的CCLINK和MODBUS-TCP协议&#xff0c;它们的不同使得数据互通比较困难&#xff0c;但捷米JM-CCLK-TCP网关的出现改变了这一切。 1捷米JM-CCLK-TCP是一款自主研发的CCLINK从站功能的通讯网关&#xff0c;它的主要功能是将各种…

D455+VINS-Fusion+surfelmapping 稠密建图(三)

继续&#xff0c;由surfelmapping建立的点云生成octomap八叉树栅格地图 一、安装OctomapServer 建图包 安装插件 sudo apt-get install ros-melodic-octomap-ros sudo apt-get install ros-melodic-octomap-msgs sudo apt-get install ros-melodic-octomap-server sudo apt-…

cubemx hal stm32 舵机 可减速 任意位置停止 驱动代码

CubeMX配置 对于 STM32 F407VE 这里的84是来自APB1那路2倍频得到&#xff1a; 代码部分 两个舵机都是180度的 servo.c #include "servo.h" #include "tim.h" #include "stdio.h"__IO uint32_t g_SteerUWT[2] {0}; uint16_t g_SteerDeg[…

青大数据结构【2014】

一、单选 二、简答 为了解决顺序队列的假溢出问题&#xff0c;提出了循环队列&#xff0c;即把存储队列的表从逻辑上看成一个环 判别队列空和满有三种方法&#xff1a; 1&#xff09;采用计数器判别&#xff0c;空时&#xff0c;计数器为0&#xff1b;满时&#xff0c;计数器…

【设计模式——学习笔记】23种设计模式——中介者模式Mediator(原理讲解+应用场景介绍+案例介绍+Java代码实现)

文章目录 案例引入案例一普通实现中介者模式 案例二 介绍基础介绍登场角色尚硅谷 《图解设计模式》 案例实现案例一&#xff1a;智能家庭类图实现 案例二&#xff1a;登录页面逻辑实现说明类图实现 总结文章说明 案例引入 案例一 普通实现 在租房过程中&#xff0c;客户可能…

css 实现 html 元素内文字水平垂直居中的N种方法

上一篇博文写了div 中元素居中的N种常用方法&#xff0c;那么单个html元素&#xff1a;div&#xff08;块级元素代表&#xff09;&#xff0c;span&#xff08;行内元素代表&#xff09;中的文字如何水平垂直都居中呢&#xff1f;实现方法如下&#xff1a; 本文例子使用的 html…

机器学习---对数几率回归

1. 逻辑回归 逻辑回归&#xff08;Logistic Regression&#xff09;的模型是一个非线性模型&#xff0c; sigmoid函数&#xff0c;又称逻辑回归函数。但是它本质上又是一个线性回归模型&#xff0c;因为除去sigmoid映射函 数关系&#xff0c;其他的步骤&#xff0c;算法都是…

阿里云预装LAMP应用导致MySQL不显示访问密码如何解决

&#x1f600;前言 本篇博文是关于阿里云云服务器ECS部署MySQL过程中出现的一下坑&#xff0c;希望能够帮助到您&#x1f60a; &#x1f3e0;个人主页&#xff1a;晨犀主页 &#x1f9d1;个人简介&#xff1a;大家好&#xff0c;我是晨犀&#xff0c;希望我的文章可以帮助到大家…

SUB-1G SOC芯片DP4306F 32 位 ARM Cortex-M0+内核替代CMT2380F32

DP4306F是一款高性能低功耗的单片集成收发机&#xff0c;集成MO核MCU&#xff0c;工作频率可覆盖200MHiz^ 1000MHz。 支持230/408/433/470/868/915频段。该芯片集成了射频接收器、射频发射器、频率综合器、GFSK调制器、GFSK解调器等功能模块。通过SPI接口可以对输出功率、频道选…

gitlab-Runner搭建

root wget https://packages.gitlab.com/runner/gitlab-runner/packages/fedora/29/gitlab-runner-12.6.0-1.x86_64.rpm/download.rpm rpm -ivh download.rpm ---- 安装 rpm -Uvh download.rpm -----更新升级 然后运行&#xff1a; gitlab-runner register --url https://git…

38 | 浦发银行股票分析案例

本文将通过一个浦发银行股票分析案例,探讨如何从多个维度对股票进行分析,包括基本面、技术面和市场环境等因素。我们将深入挖掘浦发银行的财务数据、业务模式以及市场定位,以了解其内在价值和潜在风险。同时,我们还将考察技术面的指标,如价格走势、均线形态等,以揭示市场…

ThinkPHP8命名规范-ThinkPHP8知识详解

本文主要讲解thinkphp8的命名规范&#xff0c;主要包括&#xff1a;遵循PHP自身的PSR-2命名规范和PSR-4自动加载规范、目录和文件命名规范、函数和类、属性命名规范、常量和配置命名规范、数据表和字段命名规范、不能使用PHP保留字。 在使用thinkphp8开发项目之前&#xff0c;…

线程转换状态,傻傻分不清等待和阻塞吗?你还在暴力的停止线程吗?

线程切换 线程创建之后&#xff0c;调用start()方法开始运行。当线程执行wait()方法之后&#xff0c;线程进入等待状态。进入等待状态的线程需要依靠其他线程的通知才能够返回到运行状态&#xff0c;而超时等待状态相当于在等待状态的基础上增加了超时限制&#xff0c;也就是超…

腾讯云服务器竞价实例是什么?适用于什么行业?有啥优惠?

腾讯云服务器CVM计费模式分为包年包月、按量计费和竞价实例&#xff0c;什么是竞价实例&#xff1f;竞价实例和按量付费相类似&#xff0c;优势是价格更划算&#xff0c;缺点是云服务器实例有被自动释放风险&#xff0c;腾讯云服务器网来详细说下什么是竞价实例&#xff1f;以及…

GUI、多线程编程、网络编程简介

GUI、多线程编程、网络编程简介 文章目录 GUI简介什么是GUIGUI有什么用使用方法 多线程编程什么是多线程编程多线程编程有什么用提高程序的响应能力提高程序的性能实现异步编程并发数据访问和共享资源实现复杂的算法和任务分解 进行多线程编程的步骤 网络编程什么是网络编程网络…

JMeter处理接口签名之BeanShell实现MD5加密

项目A需要给项目B提供一个接口&#xff0c;这个接口加密了&#xff0c;现在需要测试这个接口&#xff0c;需要怎么编写脚本呢&#xff1f;实现接口签名的方式有两种&#xff1a;BeanShell实现MD5加密和函数助手实现MD5加密&#xff0c;之前已经分享过了函数助手实现MD5加密&…