Meta开发了一个AI模型,尝试解决维基百科的「性别偏见」问题

aac688b87c6a23db6616b860ae8f79d9.png

来源:SiliconANGLE

出品:科技行者

撰文:海外来电

图片:海外来电

为了解决两性人物传记比例失衡的情况,Meta操碎了心。

维基百科一直是全球访问量Top 10的网站,是许多人搜索历史人物与领创者资讯的第一站,但这些人物的传记,并不总被“平等”的呈现在维基百科上。

Meta人工智能研究科学家Angela Fan在一篇博文中指出,维基百科的所有英文传记中只有20%是关于女性的。且这个数字在交叉性群体中估计就更少了,例如科学界的女性、非洲的女性和亚洲的女性等。

甚至,维基百科内容里“女性代表不足”的情况,也延伸到了该组织本身,该网站上只有15%的编辑表明自己是女性(来自维基媒体《2021年社群洞察报告》)。

Angela Fan提到,“女性在历史上对科学、政治、社会甚至创新创业的各个部分都产生了巨大影响。但是这些女性人物却被忽视,或是被以不成比例的方式在维基百科上呈现。”

比如,加拿大物理学家Donna Strickland,曾在2018年获得诺贝尔物理学奖,第一时间维基百科上却无法找到任何关于她的资讯,直到维基百科发布了关于她的工作传记后才得到改善,然而那时距离她获得诺奖已经过去很多天了。”

针对女性传记缺乏的情况,Meta公司宣布开源旗下的一个“生成式(Generative)”人工智能模型,该模型可以自动研究并创建一些重要人物的高质量传记文章。

该模型的工作方式与人类研究员的工作方式相似,分三步走:首先是「检索模块」,搜索特定人物的相关信息;然后是「生成模块」,起草一个维基百科式的人物条目;最后是「引用模块」,附上引证信息的来源。最终达到涵盖维基百科传记所需要的所有元素,如传记人物的早期生活、教育和职业。

da0077b71fb206935d8617333096a6c5.png

由于该AI系统仍还存在一些限制,因此在定位上,需要能与维基百科编辑互补——由AI系统产生草稿,接着再由编辑进行事实查证和补充。模型的限制包括,用来创建维基百科条目的网页内容,可能存在文化偏见,需要依靠人工鉴别;而且在技术上,文本生成系统容易产生幻觉(Hallucination),也就是非事实的内容;此外在语义方面,AI的连贯性和逻辑也有些力不从心。

即便如此,该AI模型仍然令人印象深刻。下图彩色文本,是由AI模型替无脊椎动物的研究先驱Libbie Hyman,所生成的简短传记。绿色文本来自参照文章;紫色文本则来自网络上的证据;橘色文本则表示幻觉,是由模型脑补,无法被验证的资讯。

5bd73e8543ec038f8c8d7db2f61165ec.png

虽然模型所生成的结果无法直接发布,但该模型已经拿到了足够多与Libbie Hyman相关的信息(包括对无脊椎动物的研究、重要出版物和工作等),人类研究员或作家可以根据这些信息迅速上手并完成这篇文章。

尽管技术方面还在完善中,但这是对维基百科内容的性别平等踏出的重要一步。研究人员提到,他们目前的工作,仅是解决一个复杂问题的一小部分,接下来还有很多工作要做,包括识别不同的“偏见”问题:比如女性传记往往涉及额外的生活细节,“离婚”一词出现在女性传记的频率是男性传记的4倍;一些“小报”往往更关注女性的生活,而这些细节可能冲淡人物更应该被关注的成就;跨性别和二元性别人物的传记,往往长度更长,但是大部分章节都是描写个人生活,而非个人成就。

为了改进该模型,Meta还发布了一个数据集,数据集可用于评估该模型基于1527份来自“边缘化群体”的女性传记中的表现。Meta表示,这些数据可用于训练该模型的迭代并评估模型的性能。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

c7743132f68d49f5021762704eee4243.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/482316.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

RISC-V正在采取行动,避免MIPS类的碎片化

来源:半导体行业观察在技术重量级人物的支持下,RISC-V 不断增长,但也带来了挑战:鼓励 CPU 设计人员保持一致,并避免MIPS和Android中发生的那种碎片化。考虑到这一点,协调开源指令集架构 (ISA) 开发的 RISC-…

复旦副教授魏忠钰:AI和人类对垒「奇葩说」,如何打造智能辩手?

来源: 智源社区作者:魏忠钰整理:熊宇轩导读:想象一下,在一场AI和人类对垒的「奇葩说」,智能辩手的表现会如何?论辩的过程,既需要理解对方的表达,同时根据对方的观点生成自…

EleutherAI:当OpenAI不够开放时,我们该如何选择?

来源:ScienceAI编辑:萝卜皮人工智能最令人不安的事情之一是它超越了人类控制、遏制或规范它的权力。然而,它可能会产生可怕的结果,例如药物发现人工智能最近错误地发现了可用作化学武器的致命毒素。今天,没有比 Eleuth…

星地融合→→→6G移动通信关键技术的未来

来源:人民邮电报作者:柯文卫星通信与地面移动通信融合构建全球无缝覆盖的星地融合网络,这一趋势作为未来6G网络技术发展的重要方向得到业界广泛认可,成为当前学术界和产业界研究的热点。  中国信科副总经理、专家委主任&#xf…

这就是深度学习如此强大的原因

来源:ScienceAI编译:绿萝据报道称,由于采用基于云的技术和在大数据中使用深度学习系统,深度学习的使用在过去十年中迅速增长,预计到 2028 年,深度学习的市场规模将达到 930 亿美元。但究竟什么是深度学习&a…

Java基础语法之Map

浅谈Map及其遍历的四种方式 Map简介 Map提供了一种映射关系,其中的元素是以键值对(key-value)的形式存储的,Map中的键值对以Entry类型的对象实例形式存在;Map集合没有继承Collection接口,其提供的是key到value的映射…

谁是ASML的最大股东?为何荷兰光刻巨头要听美国的话?

来源:EETOP整理:technews目前能生产7 纳米以下芯片的极紫外光(EUV) 光刻机,只有荷兰ASML,ASML可说是掌握全球芯片先进制程的关键。ASML 的EUV 光刻机通常优先供货给台积电、三星、英特尔三家,其他要买都要排在三家之后…

SpringMVC详细执行流程与组件说明

SpringMVC详细执行流程与组件说明 文章目录SpringMVC详细执行流程与组件说明1.SpringMVC架构流程2.流程图3.组件说明1.SpringMVC架构流程 用户发送请求至前端控制器DispatcherServlet; DispatcherServlet收到请求调用HandlerMapping处理器映射器; 处理器映射器根据前端请求的…

机器学习的重新思考:人工智能如何学习“失忆”?

来源:Samuel Greengard作者:Samuel Greengard编译:维克多机器学习已经成为各行各业的宝藏工具,常被用来构建系统,帮助人们发现那些容易忽略的细节,并辅助决策。尽管已经取得了惊艳的结果,但是也…

浅谈Spring IOC和DI及Spring工厂类

浅谈Spring IOC和DI及Spring的工厂类 文章目录浅谈Spring IOC和DI及Spring的工厂类一. IOC1.什么是IOC2.为什么使用IOC传统开发模式的弊端3. 使用spring-IOC步骤二. DI1.什么是DI2.传统面向接口编程2.使用DI方式三. Spring的工厂类一. IOC 1.什么是IOC ​ IOC: Inversion of …

城市大脑标准体系与评价指标总体框架研究

来源:城市大脑全球标准研究组根据城市大脑标准的前期研究和中国指挥与控制学会(CICC)《城市大脑建设规范》标准启动会的专家意见,形成城市大脑标准体系与评价指标总体框架(如图1所示),供各位专家探讨&#…

AOP和Spring AOP介绍

AOP和Spring AOP介绍 文章目录AOP和Spring AOP介绍一.AOP简介二. 传统开发存在的弊端三. AOP实现原理四.Spring AOP五.AOP相关术语一.AOP简介 AOP为Aspect Oriented Programming的缩写,意为:面向切面编程。是OOP的延续,是软件开发中的一个热…

新鲜出炉!大规模神经网络最新综述!

来源:arXiv编译:机器之心在本综述论文中,研究者解释了不同技术的工作原理、评估和比较,还分析了一些实现这些技术的框架。现代深度学习和人工智能技术的发展涉及使用深度神经网络(DNN)来解决图像、视频、音…

数据结构与算法理论概述

数据结构与算法理论概述 文章目录数据结构与算法理论概述数据结构概述◆ 数据结构涵盖的内容◆ 存储数据算法概述◆ 算法的基本特性◆ 算法设计要求◆ 算法分析数据结构概述 狭义上:数据结构是专门研究数据存储的问题; 数据的存储包括:个体的…

战略性基础研究的由来及国际实践研究

来源:微信公众号中国科学院院刊,原载:《中国科学院院刊》2022年第3期作者:阿儒涵1,2、杨可佳3、吴丛1,2、李晓轩1,2*1 中国科学院科技战略咨询研究院2 中国科学院大学公共政策与管理学院3 挪威奥斯陆大学技术创新和文化研究中心近…

顺序表Sqlist.cpp

顺序表Sqlist.cpp 文章目录顺序表Sqlist.cpp1 顺序表插入逻辑2 顺序表删除逻辑3 代码演示4 运行结果1 顺序表插入逻辑 在表的第 i 个位置前插入一个元素 实现步骤: 将第 n 至第 i 位的元素向后移动一个位置;将要插入的元素写到第 i 个位置;表…

顺序表的插入删除查找遍历

顺序表的插入删除查找遍历 文章目录顺序表的插入删除查找遍历代码运行结果截图代码 #define Maxsize 100typedef int ElemType; typedef struct{ElemType data[Maxsize];int length; }Sqlist;void Createlink(Sqlist &L) {int a;printf("请输入你要创建的顺序表的长…

Yann LeCun最新访谈:能量模型是通向自主人工智能系统的起点

来源:ZDNet编译:钱磊编辑:陈彩娴继自监督学习之后,Yann LeCun 在接受 ZDNet 的最新访谈中又着重探讨了他在几年前曾大篇幅推崇的概念:「能量模型」(energy-based models)。什么是能量模型&#…

HTML5崛起之时,Java桌面时代就已经终结了

来源:AI前线作者:Steve Hannah翻译:核子可乐编辑:燕珊2004 年 Google Maps 的面世标志着 Java 桌面时代的终结,也改变了桌面环境下“跨平台”的基本定义。本文作者以个人视角对 Java 桌面发展历程做了回顾,…

单链表介绍及其实现

链表 文章目录链表链表的专业术语:实现链表的专业术语: 首节点:存放第一个有效数据的结点;尾结点:存放最后一个有效数据的结点;尾指针指向;头结点:头结点的数据类型和首结点的类型一…