微软面向初学者的机器学习课程:1.3-机器学习中的公平性

写在前面:最近在参与microsoft/ML-For-Beginners的翻译活动,欢迎有兴趣的朋友加入(https://github.com/microsoft/ML-For-Beginners/issues/71)

机器学习中的公平性

作者Tomomi Imura

课前测验

介绍

在本课程中,您将开始了解机器学习如何影响我们的日常生活。截至目前,系统和模型已经参与到日常决策任务中,例如医疗诊断或发现欺诈。因此,这些模型运行良好,并为每个人提供公平的结果非常重要。

想象一下,当您用于构建这些模型的数据缺少某些人口统计信息时会发生什么情况,例如种族、性别、政治观点、宗教,或者不成比例地代表了这些人口统计信息。当模型的输出被解释为有利于某些人口统计学的时候呢?申请结果如何?

在本课中,您将:

  • 提高你对机器学习中公平的重要性的认识。

  • 了解公平相关的危害。

  • 了解不公平评估和缓解措施。

先决条件

作为先决条件,请选择“负责任的人工智能原则”学习路径并观看以下主题视频:

按照此学习路径了解有关负责任 AI 的更多信息

![微软对负责任人工智能的做法](https://img.youtube.com/vi/dnC8-uUZXSc/0.jpg)[1]

???? 点击上图观看视频:微软对负责任人工智能的做法

数据和算法的不公平性

“如果你折磨数据足够长的时间,它会坦白一切” - Ronald Coase

这种说法听起来很极端,但数据确实可以被操纵以支持任何结论。这种操纵有时可能是无意中发生的。作为人类,我们都有偏见,当你在数据中引入偏见时,往往很难有意识地知道。

保证人工智能和机器学习的公平性仍然是一项复杂的社会技术挑战。这意味着它不能从纯粹的社会或技术角度来解决。

与公平相关的危害

你说的不公平是什么意思?“不公平”包括对一群人的负面影响或“伤害”,例如根据种族、性别、年龄或残疾状况定义的那些人。

与公平相关的主要危害可分为:

  • 分配,如果一个性别或种族比另一个更受青睐。

  • 服务质量。如果您针对一种特定场景训练数据,但实际情况要复杂得多,则会导致服务性能不佳。

  • 刻板印象。将给定的组与预先分配的属性相关联。

  • 诋毁。不公平地批评和标记某事或某人。

  • 代表性过高或过低。这种想法是,某个群体在某个行业中不被看到,而这个行业一直在提升,这是造成伤害的原因。

让我们来看看这些例子。

分配

考虑一个用于筛选贷款申请的假设系统。该系统倾向于选择白人男性作为比其他群体更好的候选人。因此,某些申请人的贷款被拒。

另一个例子是一家大型公司开发的一种实验性招聘工具,用于筛选应聘者。通过使用这些模型,该工具系统地歧视了一种性别,并被训练为更喜欢与另一种性别相关的词。这导致了对简历中含有“女子橄榄球队”等字样的候选人的不公正地对待。

✅ 做一点研究,找出一个真实的例子

服务质量

研究人员发现,与肤色较浅的男性相比,一些商业性的性别分类工具在肤色较深的女性图像上的错误率更高。参考

另一个臭名昭著的例子是洗手液分配器,它似乎无法感知皮肤黝黑的人。参考

刻板印象

机器翻译中存在着刻板的性别观。在将“他是护士,她是医生”翻译成土耳其语时,遇到了一些问题。土耳其语是一种无性别的语言,它有一个代词“o”来表示单数第三人称,但把这个句子从土耳其语翻译成英语,会产生“她是护士,他是医生”这样的刻板印象和错误。

诋毁

一种图像标记技术,臭名昭著地将深色皮肤的人的图像错误地标记为大猩猩。错误的标签是有害的,不仅仅是因为这个系统犯了一个错误,而且它还特别使用了一个长期以来被故意用来诋毁黑人的标签。

![AI: 我不是女人吗?](https://img.youtube.com/vi/QxuyfWoVV98/0.jpg)[2]

???? 点击上图观看视频:AI,我不是女人吗 - 一场展示AI种族主义诋毁造成的伤害的表演

代表性过高或过低

有倾向性的图像搜索结果就是一个很好的例子。在搜索男性比例等于或高于女性的职业的图片时,比如工程或首席执行官,要注意那些更倾向于特定性别的结果。

在Bing上搜索“CEO”会得到非常全面的结果

这五种主要类型的危害不是相互排斥的,一个单一的系统可以表现出一种以上的危害。此外,每个案例的严重程度各不相同。例如,不公平地给某人贴上罪犯的标签比给形象贴上错误的标签要严重得多。然而,重要的是要记住,即使是相对不严重的伤害也会让人感到疏远或被孤立,累积的影响可能会非常压抑。

✅ 讨论:重温一些例子,看看它们是否显示出不同的危害。


分配服务质量刻板印象诋毁代表性过高或过低
自动招聘系统xxx
x
机器翻译




照片加标签




检测不公平

给定系统行为不公平的原因有很多。例如,社会偏见可能会反映在用于训练它们的数据集中。例如,过度依赖历史数据可能会加剧招聘不公平。通过使用过去10年提交给公司的简历中的模式,该模型确定男性更合格,因为大多数简历来自男性,这反映了过去男性在整个科技行业的主导地位。

关于特定人群的数据不足可能是不公平的原因。例如,图像分类器对于深肤色人的图像具有较高的错误率,因为数据中没有充分代表较深的肤色。

开发过程中做出的错误假设也会导致不公平。例如,旨在根据人脸图像预测谁将犯罪的面部分析系统可能会导致破坏性假设。这可能会对错误分类的人造成重大伤害。

了解您的模型并建立公平性

尽管公平性的许多方面都没有包含在量化公平性指标中,并且不可能从系统中完全消除偏见以保证公平性,但您仍然有责任尽可能多地检测和缓解公平性问题。

当您使用机器学习模型时,通过确保模型的可解释性以及评估和减轻不公平性来理解模型非常重要。

让我们使用贷款选择示例来作为分析案例,以确定每个因素对预测的影响程度。

评价方法

  1. 识别危害(和好处)。第一步是找出危害和好处。思考行动和决策如何影响潜在客户和企业本身。

  2. 确定受影响的群体。一旦你了解了什么样的伤害或好处可能会发生,找出可能受到影响的群体。这些群体是按性别、种族或社会群体界定的吗?

  3. 定义公平性度量。最后,定义一个度量标准,这样你就可以在工作中衡量一些东西来改善这种情况。

识别危害(和好处)

与贷款相关的危害和好处是什么?想想假阴性和假阳性的情况:

假阴性(拒绝,但Y=1)-在这种情况下,将拒绝有能力偿还贷款的申请人。这是一个不利的事件,因为贷款的资源是从合格的申请人扣留。

假阳性(接受,但Y=0)-在这种情况下,申请人确实获得了贷款,但最终违约。因此,申请人的案件将被送往一个债务催收机构,这可能会影响他们未来的贷款申请。

确定受影响的群体

下一步是确定哪些群体可能受到影响。例如,在信用卡申请的情况下,模型可能会确定女性应获得比共享家庭资产的配偶低得多的信用额度。因此,由性别定义的整个人口统计数据都会受到影响。

定义公平性度量

你已经确定了伤害和受影响的群体,在本例中,是按性别划分的。现在,使用量化因子来分解它们的度量。例如,使用下面的数据,你可以看到女性的假阳性率最大,男性的假阳性率最小,而对于假阴性则相反。

✅ 在以后关于聚类的课程中,您将看到如何在代码中构建这个“混淆矩阵”


假阳性率假阴性率数量
女性0.370.2754032
男性0.310.3528620
未列出性别0.330.311266

这张桌子告诉我们几件事。首先,我们注意到数据中的未列出性别的人相对较少。数据是有偏差的,所以你需要小心解释这些数字。

在本例中,我们有3个组和2个度量。当我们考虑我们的系统如何影响贷款申请人的客户群时,这可能就足够了,但是当您想要定义更多的组时,您可能需要将其提取到更小的摘要集。为此,您可以添加更多的度量,例如每个假阴性和假阳性的最大差异或最小比率。

✅ 停下来想一想:还有哪些群体可能会受到贷款申请的影响?

减轻不公平

为了缓解不公平,探索模型生成各种缓解模型,并比较其在准确性和公平性之间的权衡,以选择最公平的模型。

这个介绍性的课程并没有深入探讨算法不公平缓解的细节,比如后处理和减少方法,但是这里有一个你可能想尝试的工具。

Fairlearn

Fairlearn 是一个开源Python包,可让您评估系统的公平性并减轻不公平性。

该工具可帮助您评估模型的预测如何影响不同的组,使您能够通过使用公平性和性能指标来比较多个模型,并提供一组算法来减轻二元分类和回归中的不公平性。

  • 通过查看Fairlearn的GitHub了解如何使用不同的组件

  • 浏览用户指南, 示例

  • 尝试一些 示例Notebook.

  • 了解Azure机器学习中机器学习模型如何启用公平性评估。

  • 看看这些示例Notebook了解Azure机器学习中的更多公平性评估场景。


???? 挑战

为了防止首先引入偏见,我们应该:

  • 在系统工作人员中有不同的背景和观点

  • 获取反映我们社会多样性的数据集

  • 开发更好的方法来检测和纠正偏差

想想现实生活中的场景,在模型构建和使用中明显存在不公平。我们还应该考虑什么?

课后测验

复习与自学

在本课中,您学习了机器学习中公平和不公平概念的一些基础知识。

观看本次研讨会,深入探讨以下主题:

  • YouTube:人工智能系统中与公平相关的危害:示例、评估和缓解Hanna Wallach和Miro Dudik人工智能系统中与公平相关的危害:示例、评估和缓解-YouTube

另外,请阅读:

  • 微软RAI资源中心:负责人工智能资源-微软人工智能

  • 微软FATE研究小组:FATE:AI 中的公平、问责、透明和道德-微软研究院

探索Fairlearn工具箱

Fairlearn

了解Azure机器学习的工具以确保公平性

  • Azure机器学习

任务

探索Fairlearn

欢迎关注我的个人公众号”My IO“

参考

[1]

微软对负责任人工智能的做法: https://youtu.be/dnC8-uUZXSc

[2]

AI, 我不是女人吗?: https://www.youtube.com/watch?v=QxuyfWoVV98

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/300844.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[每日一题] 11gOCP 1z0-052 :2013-09-23 Oracle11g 内存参数设置...................................C7...

转载请注明出处:http://blog.csdn.net/guoyjoe/article/details/11924597正确答案:CD(题库给出的答案是AD,大家要相信自己,有些答案是错的!一切以实战为依据)一、我们先来看Oracle 11g内存架构图…

童年各大名场面~ | 今日最佳

全世界只有3.14 % 的人关注了青少年数学之旅(图源网络,侵权删)随便一截就是表情包↓ ↓ ↓

android mvvm流程图,MVVM框架模式详解

MVVM 定义MVVM 是 Model-View-ViewModel 的缩写,它是一种基于前端开发的架构模式,其核心是提供对 View 和 ViewModel 的双向数据绑定,这使得 ViewModel 的状态改变可以自动传递给 View,即所谓的数据双向绑定。在 MVVM 的框架下视图…

Windows 11 操作系统最低硬件要求

以下是在您电脑上安装 Windows 11 操作系统的最低要求。如果您的电脑不满足这些要求,您可能无法在设备上安装全新的 Windows 11 操作系统。处理器( CPU):1 GHz 或更快的支持 64 位的中央处理器(双核或多核)…

法国一家夜总会上演机器人钢管舞

全世界只有3.14 % 的人关注了青少年数学之旅星空新闻报道,法国SC-Club夜总会9月3日邀请机器人跳钢管舞,庆祝其开业5周年。该机器人脚踩高跟鞋,头上是一台CCTV监控仪。发明者称,这是为了引发人们对于“窥探”的思考。店主表示这次演…

Binding(三):资源和ValueConverter

这节讲资源和值转换器(ValueConverter)。资源在XAML中,我们想要使用外部的数据或者类,需要引入其命名空间,然后将其定义为XAML页面的资源,供给控件使用,或者我们需要封装一个共用的样式,同样也需要定义成资…

c语言 overflow_C语言和其他语言的不得不说的差别!

提到C语言,我们知道c语言和其他高级语言的最大的区别就是C语言是要操作内存的!我们需要知道——变量,其实是内存地址的一个抽像名字罢了。在静态编译的程序中,所有的变量名都会在编译时被转成内存地址。机器是不知道我们取的名字的…

html省市区选择器代码,js实现一个省市区三级联动选择框代码分享

运行效果:部分代码:当然首先你数据库中要有这个table,不然你没有数据.....^_^所在地:${xzqh.province}js代码:/*** 加载市**/function loadCity() {var provinceId $("#provinceSelect option:selected").val();if(pro…

做人开心最重要

做人开心最重要 转载于:https://www.cnblogs.com/LeeWenjie/archive/2006/11/23/569502.html

你和学霸的差距,不只是成绩

教育不是只有在校园学习不是只有课堂阅读不是只有书上这几个移动的课堂,可以让大家随时关注它们带你学习更多知识【关注方式 】1 - 搜索公众号ID关注2 - 长按二维码识别关注数学好物ID: webaoming简介:“数学好物”是一个致力为数学爱好者与家长&#x…

Storyboard.storyboard could not be opened. Could not read the archive.

Storyboard.storyboard could not be opened. Could not read the archive. Please use a newer version of Xcode. Consider changing the documents Development Target to preserve compatibility. 用低版本xcode打开高版本xcode下创建的项目时会出现这个错误。 解决办法&a…

Binding(二):控件关联和代码提升

上节我们讲到,使用Binding,我们可以关联后台代码中的属性,在某些情况下,我们可能需要将两个控件关联起来,借助Binding,我们也可以轻松的实现。关联控件设想这样一个场景,界面中有个CheckBox&…

众望所归!中国机器狗能【后空翻】了。。。

全世界只有3.14 % 的人关注了青少年数学之旅在北京亦庄举办的世界机器人大会昨天结束了,这次大会上明显的感觉机械狗多了不少,中瑞福宁展示了四足多用途机器人Anymal,深度学习加持爬行、走路、跑步、跳舞样样精通:上楼梯的Anymal算…

男人别让爱你的女孩流泪

曾经以为付出就会有回报,付出才知道,在她的心里我始终不是最重要,无可奈何花落去,似曾相识燕归来。 经年少轻狂的我不知道什么是珍贵,直到有天,我回忆过去,我才知道眼泪的味道是咸的…… 第一次…

Binding(一):数据绑定

这节开始分几期来讲一下WPF中Binding的相关用法,本节主要讲使用Binding进行数据绑定。Binding的作用在WinForm中,我们要想对控件赋值,需要在后台代码中拿到控件对象进行操作,这种赋值形式,从根本上是无法实现界面与逻辑…

世纪渣男何书桓! | 今日最佳

全世界只有3.14 % 的人关注了青少年数学之旅(图源网络,侵权删)渣男,实锤!↓ ↓ ↓

你也可以搞懂的微服务第一篇——来自ThoughtWork的学习体验

????欢迎点赞 :???? 收藏 ⭐留言 ???? 如有错误敬请指正,赐人玫瑰,手留余香!????本文作者:由webmote 原创,首发于 【掘金】????作者格言:生活在于折腾,当你不折…

laravel缓存html,Laravel 静态页面缓存 JosephSilber/page-cache - 码农天地

JosephSilber/page-cache Laravel 静态页面缓存2020-02-26 09:39:53Laravel 页面缓存这个包允许您轻松地将响应缓存为磁盘上的静态文件,以便更快速地加载页面。包管理地址:安装:用 composer 安装 page-cache 包:composer require …

pca 累积方差贡献率公式_机器学习数据降维方法:PCA主成分分析

PCA在机器学习中很常用,是一种无参数的数据降维方法。PCA步骤:将原始数据按列组成n行m列矩阵X将X的每一行(代表一个属性字段)进行零均值化,即减去这一行的均值求出协方差矩阵求出协方差矩阵的特征值及对应的特征向量将特征向量按对应特征值大…

教程丨亿万网友一起换头像欢庆新中国成立70周年,就差你了!

全世界只有3.14 % 的人关注了青少年数学之旅眼看着2019年国庆节马上要到了大街小巷都挂起来显眼的国旗而今天早上朋友圈更是被“国旗”刷屏一打开朋友圈满屏的国旗微信头像不少网友们都以为只要在朋友圈“微信官方”就能获取定制国旗头像虽说这是一个官方的彩蛋但实际上并不是这…