​数据集拥有自己的世界观?不,其实还是人的世界观

68d8e03d32564fb9a0f3f1b6bd64a516.png

来源: AI科技评论

编译:Antonio

编辑:陈彩娴

伴随深度学习的不断日常化,数据集中的偏见(bias)和公正性(fairness)已经成为一个热门研究方向。

偏见在AI领域是一个很棘手的话题:有些偏见是有益的,例如噪声数据可以增加模型的鲁棒性,有些偏见是有害的,例如倾向对有色人种识别错误。

而且,当我们得到一个不完美的模型的时候,其中的数据集到底存在什么偏见?这些偏见是如何产生的?

谷歌的PAIR (People + AI Research)团队最近发表了一篇博文,用一个很简单有趣的例子讨论了这些问题。

129fc93f9cee8bdd80e3d28c78ec9ebf.png

原文链接:

https://pair.withgoogle. com/explorables/dataset-worldviews/

1

有偏见的分类

假设我们拥有如下所示的不同形状的数据集,它们对应的标签是有无阴影,如下图。

b84b28e166790ae93e3d8ff9480e00de.png

利用页面上的交互式分类器,可以分类出如下的结果,并得出相应的准确性。

a213c7a583a821f15a9db724fff7441a.png

模型并不完美,为了对结果进行纠正,你可能想知道模型正在犯什么错误,或者,数据存在哪种类型的偏见?

2

公正性分析

由于各个图形的主要区别在于形状,一个可能的偏见存在于形状的差别。通过观察你可能认为三个最主要的形状主要是圆、三角形和矩形。为了证实这个假设,你要确信你的模型在面对圆、三角形和矩形的时候模型的表现能力的一样的。接下来我们来做公正性分析(fairness analysis)。

首先我们需要对每个的形状进行标注,但是一个问题是,有些形状并不能很肯定地确定是什么形状,这时候有两种策略,一是把这种形状判断为最有可能是圆、三角形和矩形(with their best guess);一种是给出一个选项:上述三种形状都不是(as "other")。之后我们分析模型对于每一类形状的分类准确率。该交互式页面给了两种策略的结果:

策略一:寻找最有可能的形状:

71392757f47e0fd5dbe93cbcef567ddf.png

第一种策略表明分类器对于矩形分类的结果最好,圆次之,三角形最差。不过这可以表明模型对三角形存在偏见吗?我们在页面上切换第二种策略。

策略二:上述都不是:

cf52f05bdc1b9127c38cdeb7c0aa7347.png

结果发生了变化!第二种策略则表明分类器对于三角形和矩形分类结果都最好,圆却最差。我们对于偏见的理解因为我们制定分类的策略不同而不同,换言之,每一种分类方式代表着采取不同的角度看待哪些是重要的分类特征。而决定数据集和最终模型决策的是你——制定策略的人。也就是每个数据集都代表一种“世界观”,其收集背后莫不代表着人的意志。

所以,再回过头来想想,还有哪些策略或者规则的指定可能会影响我们的对于公正性的判断?

对,我们当初对于分类的标准是依照形状,比如圆、三角形或者矩形,这也是我们人为定的标准,如果换成”尖的“或者”圆的“呢?或者“小的”或者“大的”呢?下图给出了不同评价标准下,正确和错误分类的个体:

d10e7d2e206c16a65896166fa455e71b.png

图注:当类别标准是“尖的”或者“圆的”,以及其它模糊类别是“寻找最有可能的形状”的时候的分类结果

bf97e62af4391df8449969c2ca91ee81.png

图注:当类别标准是“小”或者“大的”,以及其它模糊类别是“寻找最有可能的形状”的时候的分类结果

可以看到,每当选择一种标准的时候,所得到的错误分类的数据分布也都不同,因而每种情况下对于实例的偏见程度或者公正性分析也都会出现偏差——偏见似乎也有了偏见。

3

标签在讲述故事

回顾一下,假设你是收集该数据集的负责成员,刚开始你做出关于与偏见相关的分类类别的决策,所有的形状实例到底怎么分?你按照“尖的”和“圆的”,也就是下图:

0059a08137f6a48229b352929ffcf899.png

其它标注者试图回答下述问题:这个图形是“尖的”还是“圆的”?

37bd192b5aca5144d239ae1a9fbff367.png

之后,收集完毕,你根据上述错误类别分析,你可以得到分类器在尖的形状表现的好,圆的则表现的差,之后便有了如下的报告:

a78964ad507a32019b5f19239627cc85.png

然后,如果一开始的评价标准是“大的”还是“小的”,重复上述步骤,你却可以得到分类器在小的形状上分类效果好,于是便有了这样的故事...

93645d4f9e661e7b78cc3a666c7aa522.png

想要避免这个问题的一个自然的解决方式是,收集更多的数据和更多的特征:如果我们有足够多的数据,知道它们足够多的细节,我们将可以避免做出不同的分类决策,从而产生唯一的偏见的影响因子。

不过,似乎并非这样。想象一下,当我们描述我们周围的一件事情的时候,不管是向一个朋友讲述一件事情的时候,还是告知计算机关于形状的事情的时候,我们都会自觉不自觉地选择自己认为的最重要的部分,或者选择用什么工具去传递它。

不管我们是否这么想,我们无时无刻不在做分类——

e62b8daba0500fc122fe23048c24317e.png

正如我们在形状的例子中所看到的那样,所有的选择都使得某些特征比其它的特征更加重要,使得一些特征的差别是可见的一些却可被忽略,都使得某些事物变得容易分类有些成为噪声点。

是分类的标准在讲述整个故事。

4

真实的场景

如果我们再回顾真实的机器学习应用,比如监督学习任务中的目标检测任务。我们想象有下面一幅图片:

741832a7cc3c963e02fcbeae910553ba.png

我们想在这样的数据集上打标注,因而我们想先对其中的目标物体进行标注。其中的一种标注如下:

27ce1cadb7d8d1efdaafdc06e048f803.png

这样已经看起来很客观了,对吗?毕竟山就是山、树就是树。可是即使这样,同一张图的同一个区域的标签也可能不一样,比如这样:

2efca4d2de708d3ae0179e0cddbb17fa.png

山可以具体化名称,树也可以具体化“没有医用的植物”。

是的,并没有一个普遍的方法去对待每一个物体、每一个单词或者每一张图片。数据集总是特定时间空间和条件的结果。它们是社会的产物,它们有历史观,它们有政治色彩。而忽略这些会带来非常现实的后果。

那我们应该怎么对待这些信息呢?

一个很好的起点是反思数据所在的上下文,并且始终对数据保持好奇。

很难去判断一个数据集本身的价值——它们是客观的,普遍的,中立的吗——它可能只是反映一种你自己习惯的世界观。所以理解你自己的世界观可以告诉你所谓客观数据的局限性。时刻问自己:你对这个世界做出了什么假设?什么是感觉像是常识?什么有些违背常理?重要的是,对于数据集不应该忘记考虑:谁收集的它?为什么会收集它?谁付钱收集了它?所谓的”真值“标签来自哪里?

之后,你甚至可能会发现自己在质疑收集数据过程中的某些假设,从而对你的分类任务有更加整体地理解。

如果对你的数据有很多问题,你就已经有很好的开端了。

5

研究团队介绍

People + AI Research (PAIR) 是 Google 的一个跨学科团队,通过基础研究、构建工具、创建设计框架以及与不同社区合作来探索人工智能的人性方面。

团队的宗旨让机器学习发挥其积极潜力,因为它需要具有广泛的参与性,涉及到它影响的社区,并由不同的公民、政策制定者、活动家、艺术家等群体指导。

178880b172ef945c1949d07827f09ca6.png

该团队开发了很多有趣的可视化交互页面,探讨了很多有趣的AI+公正性或者可解释性的课题。快去试试吧!

团队官网:

https://pair.withgoogle.com/

原文链接:

https://pair.withgoogle.com/explorables/dataset-worldviews/

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

14dac17200e650c7082813e191116158.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/482468.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

图灵奖获得者Yann LeCun:未来几十年AI研究的最大挑战是「预测世界模型」

来源:机器学习研究组订阅LeCun 认为,构造自主 AI 需要预测世界模型,而世界模型必须能够执行多模态预测,对应的解决方案是一种叫做分层 JEPA(联合嵌入预测架构)的架构。该架构可以通过堆叠的方式进行更抽象、…

可重构人工智能设备展现出智能化前景

PURDUE UNIVERSITY来源:IEEE电气电子工程师一项新的研究发现,一种适应性强的新设备可以转换成人工智能硬件所需的所有关键电子元件,在机器人和自治系统中有潜在的应用。以大脑为灵感或“神经形态”的计算机硬件旨在模仿人脑从经验中自适应学习…

gin+vue的前后端分离开源项目

该项目是ginvue的前后端分离项目,使用gorm访问MySQL,其中vue前端是使用vue-element-admin框架简单实现的; go后台使用jwt,对API接口进行权限控制。此外,Web页面在token过期后的半个小时内,用户再次操作会自…

day37-数据库分组查询

1. 单表查询 2. 多表查询 ## 单表查询 前期表准备 create table emp( id int not null unique auto_increment, name varchar(20) not null, sex enum(male,female) not null default male, #大部分是男的 age int(3) unsigned not null default 28, hire_date date not null, …

指挥控制智能化现状与发展

来源:人机与认知实验室0 引言人工智能(AI)技术现已进入一个新的高速增长期,是公认最有可能改变未来世界的颠覆性技术。从“深蓝”战胜卡斯帕罗夫,到机器学习技术在语音识别、图像识别和自然语言处理等诸多…

IEEE 2022年网络、计算机和通信国际学术研讨会(ISNCC2022)

2022年网络、计算机和通信国际学术研讨会(International Symposium on Networks, Computers andCommunications,2022)主办:电气与电子工程师学会(IEEE)、IEEE 通信学会(IEEE Communications Society&#x…

【重要征稿】IEEE 2022年网络、计算机和通信国际学术研讨会(ISNCC2022)

2022年网络、计算机和通信国际学术研讨会(International Symposium on Networks, Computers andCommunications,2022)主办:电气与电子工程师学会(IEEE)、IEEE 通信学会(IEEE Communications Society&#x…

C++ 类设计核查表

参考:https://www.jianshu.com/p/01601515ca31 《大规模C程序设计》 函数接口: 1.运算符或非运算符函数? 2.自由或成员运算符? 3.虚函数或非虚函数? 4.纯虚成员函数或非纯虚成员函数? 5.静态或非静态成员函…

CICC《城市大脑建设规范》标准建设启动会在京召开

来源:中国指挥与控制学会 2022年2月27日下午,中国指挥与控制学会(以下简称:CICC)在京召开了《城市大脑建设规范》团体标准启动会。启动会邀请到了中国电信、中国电科、中国电子、联想、科大讯飞、世纪互联、北京市标准…

day38-数据库应用软件

# mysql select distinct 字段1,字段2,。。。 from 表名 where 分组之前的过滤条件 group by 分组条件 having 分组之后过滤条件 order by 排序字段1 asc,排序字段2 desc limit 5,5as语法中给某个查询结果起别名的时候需要把查询语句中…

世界被一种神秘的数学力量彻底改变了

来源:《微积分的力量》编辑:nhyilin01科学或许是唯一的神上世纪60年代,小说家赫尔曼沃克(Herman Wouk)正在为他计划中的巨著《战争风云》做调研,他去加州理工学院采访了参与过原子弹研发的物理学家&#xf…

程序异常退出后,托盘残留图标清理方法(C#)

程序猿对于宕机再熟悉不过了,如果一个程序异常退出,那我们只能在Windows日志中找到它的踪迹;如果它是一个托盘程序,异常退出后,它会停留在托盘中久久不能离去,直到我们的鼠标从它身上划过;如果一…

汪劲:生命系统中的非平衡物理学

来源:集智俱乐部作者:汪劲编译:袁郭玲编辑:邓一雪导语非平衡物理学将在生物应用中发挥重要作用,如酶动力学、新陈代谢、基因调控,细胞的结构、功能和动力学,生理学、癌症、分化和发育&#xff0…

虚拟现实和元宇宙的最大短板在哪里?

出品:科技智谷编辑:王晓东虚拟现实和元宇宙面临的最大问题不是技术问题而是功能问题。在所有关于Metaverse以及虚拟现实或VR将给我们的生活带来什么的讨论中,有一个很大的功能问题被忽略了。正如几大巨头宣传的那样,Metaverse是一…

解密通往元宇宙的三大入口,VR先上AR紧跟,但脑机接口才是未来

来源: 智东西编辑:智东西内参VR、AR和脑机接口,谁是人类通往元宇宙的合适入口?VR/AR/脑机接口是集合了微显示、传感器、芯片和算法等多项技术在内的下一代人机交互平台。回顾整个人机交互发展历程,我们看到人机交互的指令输入形式…

python enumerate用法总结(转)

原文链接:https://blog.csdn.net/churximi/article/details/51648388 enumerate()说明 enumerate()是python的内置函数enumerate在字典上是枚举、列举的意思对于一个可迭代的(iterable)/可遍历的对象(如列表、字符串)&…

特约专栏丨孙茂松教授——自然语言处理一瞥:知往鉴今瞻未来

来源:中国人工智能学会文 :孙茂松人类语言(即自然语言)的重要性无论怎么讲都不为过。社会生物学之父爱德华威尔逊曾说过:“语言是继真核细胞之后最伟大的进化成就”。科普畅销书《信息简史》的作者詹姆斯格雷克也深刻地…

安全隐患:神经网络可以隐藏恶意软件

来源:AI科技大本营(ID:rgznai100)编译:禾木木凭借数百万和数十亿的数值参数,深度学习模型可以做到很多的事情,例如,检测照片中的对象、识别语音、生成文本以及隐藏恶意软件。加州大学圣地亚哥分…

ASP.NET MVC教程四:ASP.NET MVC中页面传值的几种方式

准备 在Models文件夹里面新添加Student实体类,用来模拟从Controller向View传递数据,Student类定义如下: using System; using System.Collections.Generic; using System.Linq; using System.Web;namespace MVCStudyDemo.Models {public clas…

量子计算,后摩尔时代计算能力提升的解决方案

来源:微信公众号蓝海长青智库原载于《学习时报》2022年3月2日刊作者:朱晓波1、陆朝阳1、潘建伟2,31 中科学技术大学合肥微尺度物质科学国家研究中心2 中国科学院院士3 中国科学技术大学量子计算是基于量子力学的全新计算模式,具有原理上远超经…