论文速读:AI能从人类的愚蠢中学到什么?

来源:混沌巡洋舰

本文来自对下面论文的编译和解读:

导读:随着机器在某些认知问题上超越人类,人机协作将会带来越来越显著的影响。造成人类偏见的三个主要原因(小而不完整的数据集,从自己的决策结果中学习,以及有偏见的推断和评估过程),也会造成机器学习的算法放大这些错误。研究人类愚蠢的根源,能够让我们避免在机器学习算法设计中犯同样的错。

这篇文献分别讨论了四种人类常犯的错误,本文详述前俩例。准备这篇文章,可以让读者对照反思自己是不是正在被打脸,机器学习和人工智能从业者可以从学习和决策偏差的心理学中学习到如何改进AI的经验。

1)过少的数据集

人类能够从很小的数据集中进行学习,只依靠几次经历就了解一个概念,然而这既是人类认知的强项,也是人类认知的弱点。数据集稀少,人们会由于罕见事件没有出现,而对其低估。例如人们抱着侥幸心理,基于身边没有人患病,对自己患上某种疾病的概率给予过于乐观的估计。在重复博弈中,人们也会由于对尾部风险的认识不足,没有及时做好应对预案。

在我们面对少数人群时,由于数据集过少,也会将对某个人的印象投影到特定的群体上,从而过早的形成刻板印象。当我们看到少数族裔做的好事的时候,由于样本太少,也往往会被淹没在多数群体做的好事中,而不被重视。

贝叶斯算法在面对小数据集时,也会犯类似的错误,下图中左边和右边都来自相同均值,随机抽样的数据集,当数据量放大之后(从左边到右边),贝叶斯对这组数据集的平均数的判断是数据的平均值变大了,然而这只是由于算法没有考虑小数据集带来的随机波动造成的。

举例来说,面部识别软件在识别深色皮肤的人的性别方面比识别浅色皮肤的人犯了更多的错误,而这是由于训练数据集中对深色皮肤和女性的数据相对较少。 类似于对个人身上的刻板印象的算法,强化了对这个人的刻板印象。减少小数据带来的虚假的关联,不管是个人还是设计AI算法者,都需要记住不同的人群,产生数据的能力是不同的,切不可忽略那些不产生数据的人群。在网课的推广中,由于忽略了那些没有智能设备的人群,因此造成的不公平,是人类愚蠢的一个让人心痛的恶果。

2)从自己的行为中学习,因果倒置

人类的行为很少仅仅是客观的观察,往往受到人类决策的影响。例如,我们只知道我们吃过的饭菜,而不是我们错过的饭菜。机器学习系统也经常在世界上采取行动,并接收数据,这取决于这些行动的后果,在包括机器人,广告,保险,金融和操作的领域。不幸的是,从自己选择的行为中学习,就像从小样本中学习一样,会产生偏见和错误的信念。例如由于人们有部分的能力避开他们不喜欢的人,消极的第一印象往往比积极的第一印象持续的时间更长。

决策者倾向于对具有可变结果的行为做出过于负面的估计,然后尽量避免这种行为,即使其平均结果实际上是正面的。 例如下图中行动的后果有好有坏,是随机出现的,然而如果决策者对某件事的评价一旦低过一个阈值,就不再尝试,从而永远不会得到纠正式反馈。例如你知道从长期来看,股票市场的收益大于银行,但由于某一次跌的太低,从此就远离股市。

由于将个人选择引入,同样会促进人与人之间的偏见。与例如如家庭成员的亲密群体进行互动和了解通常是不可避免的,因而会对其有更准确的认识,而了解群体之外的成员通常是选择性的,人们会因为偶然的第一印象而持续避免接触某类人,从而固化对其的负面印象。对于诸如幽默感智力这样需要互动才能体现的特质,往往是由于你的行为让和你互动的B显得比C更聪明,但事实上这仅仅因为你预期C无法和你进行有质量的交流,从而促成自我实现的预言。人类和机器面临的另一个共同的偏好是选择低维度数据,而不选择高维数据,从而由于自己的选择性忽视而造成偏见。

假设招聘人员审查有或没有学士学位的申请人(下图中的特征一),以及有或没有两年相关经验的申请人(特征二),并且具有任何一种资格的申请人将在公司表现良好。在雇用了几个人之后,招聘人员可能会注意到,所有拥有学士学位的申请人都表现良好,而一些没有学士学位的申请人则表现不佳,因此假设这是唯一的重要特征。如果招聘人员根据这一假设采取行动,那么未来他们将雇用拥有学士学位的申请人,而拒绝没有学士学位的申请人,因此永远不会知道拥有两年工作经验的申请人也表现良好,即使他们没有学士学位。偶然性的申请人反馈意见使招聘人员只注意到申请的一个方面,从而使他们拒绝合适的申请人,并对申请人应具备的特征产生错误的信念。

与之类似的是伯克森悖论,即你的选择标准影响你考察的范围,而你考察的范围会影响你的结论。由于伯克森悖论,会让你产生“寒门出贵子”、“为富不仁”这样虚假的关联,从因果推断的角度来看,当你选择控制了碰撞变量之后,你就会得到虚假的相关性。

在人机互动中,类似的错误体现在将警察派往过去发生过犯罪的地方的预警算法,可能会导致警察过度执法,随着时间的推移,会形成一个反馈循环,越来越多的警察被派往少数犯罪热点,从而导致在那里观察到的犯罪比例越来越高。在强化学习中,通过允许一种算法只从其在所作选择和收到的反馈中没有任何作用的抽样数据中学习。为了避免由于少量信息造成了决策固化,强化学习的agent需要从事次优行为,降低短期收益,以求收集额外信息带来的的长期回报。 就维持治安而言,这意味着接受为了确保犯罪更公平地有机会在不同地点被发现,而放弃可能的犯罪减少。

3)总结

另一种人类的错误来自于人类自身,例如人在推理过程中内生的偏差,例如使用启发式方法时面对的问题。这里由于其不具有对个人行动指导价值,没有详述。科学和技术往往是通过启发性的比喻而进步的。最近人们对机器学习和人工智能的兴趣正是源于机器和人类之间的比较,以及基于机器的系统实现了人类认知的某些方面,但却提高了人类的能力。然而,这个观点的也意味着承认这些系统,尽管它们是智能的,但是会像人们一样成为认知陷阱和偏见的受害者。对于人工智能的最新进展,一个健康的态度应该是认识到,不存在没有偏见的系统,对于在一个模糊和不确定的世界中运作的智能适应性agent来说,假设没有偏见反而是最根本性的偏见。

 在大多数情况下,心理学家得出的关于人类偏见的结论并不能直接转化为改进的机器学习模型。算法偏见的技术解决方案可能会来自更多的计算领域,就像神经网络和强化学习研究尽管起源于心理学,但在计算机科学部门却蓬勃发展一样。 不过心理学文献可以提供一个路线图,告诉我们偏见可能在哪里以及如何出现,可以做出权衡以减少偏见,以及有偏见但简单的决策可能无害或有益的情况。随着机器学习和人工智能系统进入他们正在做出改变人生的决定的领域,比如医疗和刑事司法,这个路线图非常需要。我们希望,对阿莫斯 · 特沃斯基所说的“天生愚蠢”的研究能够导致更有效、更公平的人工智能。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/488444.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

struts2的核心和工作原理

在学习struts2之前,首先我们要明确使用struts2的目的是什么?它能给我们带来什么样的优点? 设计目标 Struts设计的第一目标就是使MVC模式应用于web程序设计。在这儿MVC模式的优点就不在提了。技术优势 Struts2有双方面的技术优势,一…

python函数递归法求一个数各位数之和_python – 设计一个使用digit_sum计算数字总和的递归函数...

要获得(正整数)数字的最后一位数,您可以计算模数&#xff1a;last_digit n % 10该数字的其余部分(不包括最后一个地方)是&#xff1a;rest (n - last_digit) / 10理论上这应该足以分割数字并添加数字&#xff1a;def sum_digits(n):if n < 10:return nelse:last_digit n …

mysql允许root远程连接_西部数码使用指南:远程桌面之终端服务器超出了最大允许连接数解决...

版权归西部数码所有&#xff0c;原文链接&#xff1a;https://www.west.cn/faq/list.asp?unid739出现这种情况的原因和解决办法。 原因:用远程桌面链接登录到终端服务器时经常会遇到“终端服务器超出最大允许链接数”诸如此类错误导致无法正常登录终端服务器&#xff0c;引起该…

关于征集2020重大科学问题和工程技术难题的通知

来源&#xff1a;中国指挥与控制学会学会全体会员&#xff1a;为研判未来科技发展趋势、前瞻谋划和布局前沿科技领域与方向&#xff0c;瞄准世界科技前沿&#xff0c;推进世界科技强国建设&#xff0c;根据《中国科协办公厅关于征集2020重大科学问题和工程技术难题的通知》精神…

java hive配置_Hive配置项的含义详解(1)

一个hive任务&#xff0c;如何才算是优化的任务&#xff0c;hadoop job config里哪些配置能影响hive的效率。看看hive的详细配置我们可以略知一二。hive的配置&#xff1a;hive.ddl.output.format&#xff1a;hive的ddl语句的输出格式&#xff0c;默认是text&#xff0c;纯文本…

怎么在别人网站注入js脚本_别人的网站是怎么实现引流的?这些站外SEO技巧是关键...

点击上方蓝字关注我们&#xff01;因为分享&#xff0c;我们相遇在SEO路上“网站上线一段时间了&#xff0c;为什么没有流量&#xff1f;为什么没有询盘&#xff1f;”对于做网络营销的企业而言&#xff0c;网站流量与询盘是建立网站的根本目的&#xff0c;可是为什么操作了一段…

比尔盖茨NEJM发文:新冠肺炎是百年一遇的流行病!全世界应该如何应对?

来源&#xff1a;生物谷面对任何危机&#xff0c;政府都有两个同等重要的责任&#xff1a;解决眼前的问题&#xff0c;并防止它再次发生。COVID-19大流行就是一个恰当的例子。我们现在需要拯救生命&#xff0c;同时也需要改善我们应对疫情的方式。第一点更为紧迫&#xff0c;但…

java实现上传图片代码_Java图片上传实现代码

本文实例为大家分享了java图片上传代码&#xff0c;供大家参考&#xff0c;具体内容如下import java.io.*;import java.net.*;/**发送端*/class picsend{public static void main(String[] args) throws Exception{if(args.length!1){System.out.println("请选择一张.jpg图…

每个努力奋斗过的人,被不公正的际遇砸了满头包的时候,都有那么一瞬间的代入感。出生就是hard模式的人,早已经历了太多的劳其筋骨饿其体肤,再多的人为考验只会摧毁人对美好的向往。...

每个努力奋斗过的人&#xff0c;被不公正的际遇砸了满头包的时候&#xff0c;都有那么一瞬间的代入感。出生就是hard模式的人&#xff0c;早已经历了太多的劳其筋骨饿其体肤&#xff0c;再多的人为考验只会摧毁人对美好的向往。转载于:https://www.cnblogs.com/dj258/p/6805629…

python 利器_Python的爬虫利器之urllib

urllib包urllib是一个包含几个模块来处理请求的库&#xff1a;- urllib.request发送http请求- urllib.error处理请求过程中出现的异常- urllib.parse解析url- urllib.robotparser解析robots.txt文件一般我们爬虫只需要常用的几个&#xff0c;下面只列出比较常用的函数我们使用u…

中国数学相比与西方数学为什么会处于劣势?

来源&#xff1a;数学职业家虽然中国人更习惯【中国数学相比与西方数学为什么会处于劣势&#xff1f;】的视角&#xff0c;但私以为问【西欧数学为何可以独步天下】更合适。因为曾经辉煌过的阿拉伯数学、印度数学都落寞了。也没有其他任何地区的文明能达成西欧的成就。另外&…

java的地位和优势,Java语言之所以能持续占领霸主地位 这些优势功不可没

java作为一个真正面向对象语言&#xff0c;驰骋IT界二十余载&#xff0c;一直独占编程语言排行榜榜首&#xff0c;成为广泛使用的开发编程语言&#xff0c;为什么java就能够持续占领霸主地位呢&#xff1f;有哪些必然的优势呢&#xff1f;这首要的优势就是&#xff1a;既然是真…

WebBrowser,挖坑,跳坑,填坑

最近在 C# Asp.net 平台上的一个项目中用到了 WebBrowser 控件。自然而然就进入了 一连串的坑了。用网络上一同行的话“用WebBrowse&#xff0c;就是在给自己挖坑”。 道术太浅&#xff0c;这个坑我还是跳了。 需求&#xff1a;截取网页中的一部分&#xff0c;生成图片。 咣当咣…

python中用户尝试输入三次_用Python实现登录接口,允许尝试三次

项目需求描述&#xff1a;要求用户输入用户名和密码&#xff0c;认证成功后显示欢迎信息&#xff0c;如果连续输错三次则锁定用户名。逻辑流程图&#xff1a;实现代码&#xff1a;#!/usr/bin/env pythonimport sysaccount_file ‘account.txt‘lock_file ‘lock.txt‘# put a…

你可能会错过的3个重要AI趋势

来源&#xff1a;雷锋网以下3个趋势&#xff0c;目前可能尚未引起注意&#xff0c;但长期来看会产生重大影响。根据Gartner的一项调查&#xff0c;到2020年底&#xff0c;全球48&#xff05;的CIO将部署AI。尽管人们对AI和ML持乐观态度&#xff0c;但我仍然持怀疑态度。在可以预…

php flush nginx,Nginx+phpfastcgi下flush输出问题

最近由于业务需要,需要使用php的flush输出缓存刷新&#xff0c;处理浏览器超时问题.最初的测试代码如下:ob_start();//打开缓冲区for ($i10; $i>0; $i--){echo $i.‘‘;ob_flush();flush();sleep(1);}ob_end_flush();//输出并关闭缓冲die();本以为这样就能1秒钟输出一个数字…

线性代数知识点总结_线性代数导读+笔记

一些学习线性代数的心得和资源分享&#xff0c;供大家参考。资源Introduction to Linear Algebra, 5th Edition​math.mit.edu学线性代数主要的参考书&#xff0c;Strang 教授也算是网红了&#xff0c;讲课讲得十分浅显易懂&#xff0c;网上有配套的video&#xff0c;强烈推荐。…

5G通信网络专题报告:新一轮移动通信网络建设迎来高潮

报告来源&#xff1a;山西证券1. 移动通信网络概述1.1 移动通信网络行业界定异地间人与人、人与物、物与物进行信息的传递和交换称为通信。通信以获取信息为目的&#xff0c;实现信息传输所需的一切设备和传输媒介构成通信系统&#xff0c;通信系统大体包括终端和通信网络两部分…

Oracle 通过字段名查询其所在的表

select owner , table_name , column_name from dba_tab_columns where column_nameLOG_TYPE ;转载于:https://www.cnblogs.com/linnuo/p/6812339.html

python标准库 下载_下载python标准库--python

1 #coding:utf-82 importurllib23 importos,sys4 from BeautifulSoup import BeautifulSoup #For processing HTML5 from bs4 importBeautifulSoup6 classBookSave():7 8 dir:html文件保存目录 url&#xff1a;index.html目录 static_url:js、css所在目录的上级目录9 distingui…