神经网络其实和人一样懒惰,喜欢走捷径......

作者 | Jörn-Henrik Jacobsen, Robert Geirhos, Claudio Michaelis,深度学习研究专家

译者 | Arvin,责编 | 夕颜

出品 | CSDN(ID:CSDNnews)

以下为译文:

人工智能会很快取代放射科医生吗?最近,研究人员训练了一个深度神经网络对乳腺癌进行分类,其准确度达到了85%。当与其他三种神经网络模型结合使用时,最终的集成方法达到了出色的99%的分类准确度,可以与经过多年训练的放射专家相媲美。

 

上述关于乳腺癌的分类结果是正确的,但有一点小问题:研究人员没有使用最先进的人工深度神经网络,而是训练“自然”神经网络——更准确地说,是用四只鸽子来诊断乳腺癌。

 

2018年,加利福尼亚大学的研究员发现鸽子对乳腺组织的显微图像很敏感,还能够准确通过乳腺X光片鉴别良性、恶性乳腺癌肿瘤,经过15天的训练之后,鸽子们对乳腺癌病理切片和医学影像的判断正确率就提升到了85%左右。

然而,鸽子从未被视为医学成像的未来,大公司也没有砸钱建大规模养鸽场:与我们对深度神经网络(DNNs)的期望相比,我们对鸽子并没抱太大期望。

 

在许多方面,DNN确实没有辜负宣传和人们的希望:它们在整个社会,行业和科学领域的成功都是不可否认的,而且新的突破仍然会在几个月(甚至几周)的时间就能实现。但是,看似脱节的失效案例仍在不断发生着:DNN在识别物体方面达到了超人的性能,但是即使很小的看不见的变化或不同的背景和环境也可能使预测完全偏离。DNN可以为图像生成合理的标题,但是,令人担忧的是,DNN可以在不真正查看该图像的情况下这样做。DNN可以准确识别人脸,但对少数群体的人脸识别错误率却非常高。DNN可以根据简历预测聘用决策,但是算法在选择的过程中却会出现偏见。

 

如何调和DNN超出人类的表现,同时却可能会犯下荒谬错误之间的偏差呢?我们认为,许多失败案例不是个例,而是和DNN会无意识地遵循“捷径”策略有关。虽然表面上是成功的,但稍微发生些许偏差,这些策略通常会以失败告终。

 

“捷径”是指在标准基准上表现良好,但在更具挑战性的测试条件上表现差的决策规则。“捷径”出现的情况多种多样,在数据集和应用程序领域中无处不在。比如:

从原则上讲,捷径学习并不是一种新现象,它有很多不同的术语名称,例如“协变移位学习 ”、“反因果学习”、“数据集偏差”、“坦克传奇 ”和“聪明汉斯效果”等。 我们在这里讨论捷径学习如何结合深度学习的问题,以及我们可以做些什么来更好地理解和使用捷径学习。

 

什么是捷径?

 

在机器学习中,模型能够学习的解决方案受数据、模型体系结构、优化器和目标函数的约束。然而,这些约束往往会允许不止一个解决方案,通常有很多不同的方法来解决同一个问题。捷径是在典型测试集上表现良好,但在不同情况下失败的解决方案,暴露出与我们的意图不符的现象。

举一个例子,当在简单的星月数据集上训练时(顶行),标准的神经网络(三层,完全连接)可以轻松地对新的类似样本(数学上称为i.i.d.测试集)进行分类。但是,在稍有不同的数据集(o.o.d.测试集,最下面一行)上对其进行测试揭示了一种捷径策略:网络已学会将对象位置与类别相关联。在训练过程中,星星总是显示在图片的右上角或左下角;月亮则显示在左上角或右下角。这种模式仍然存在于来自i.i.d.测试集(中间一行)的样本中,但在o.o.d.测试图像(下排)中不存在,从而暴露了捷径现象。这里最重要的一点是,在训练设置约束下,位置和形状都是有效的解决方案,因此,没有理由期望神经网络更喜欢其中一个。然而,人类具有使用物体形状的强烈直觉。就像这个例子看起来那样,对抗性例子,偏向机器学习模型,缺乏领域通用性和输入略有变化引起的失效等都可以理解为捷径学习现象的实例。

 

例如,研究人员开发了一种机器分类器,能够从多家医院的X光扫描中成功检测出肺炎,但是对于来自新医院的扫描,它的性能却出人意料地低:该模型意外地学会了以近乎完美的精确度识别特定的医院系统(例如,通过在扫描中检测到医院特定的金属标记,请参见左图)。加上医院的肺炎患病率,它在训练过程中就可以达到相当好的预测,而根本无需了解太多肺炎的知识。分类器没有学习如何“理解”肺炎,而是选择了最简单的解决方案,仅查看标记类型。

 

深度学习之外的捷径学习

 

通常,这样的失败案例可以被视为机器学习算法不可信任的原因。然而,生物学学习者也遇到非常相似的失败模式。在牛津大学实验室的一项实验中,研究人员观察到,老鼠可以仅根据细微的色差学习到穿越复杂迷宫的方法,这非常令人惊讶,因为老鼠的视网膜仅具有基本的视觉能力,视力非常差。深入研究这个奇怪的现象,我们会发现原来老鼠欺骗了研究人员:他们在实验中根本没有使用视觉系统,而是仅仅通过迷宫壁上使用的彩色涂料的气味来区分颜色。一旦控制了气味,老鼠们卓越的颜色辨别能力就消失了。

 

动物通常以一种意想不到的方式解决一个实验范式(即数据集),而未使用人们真正感兴趣的能力,从而迷惑实验者。对人类来说,这凸显了想用比人类现有方式更复杂的方式来解决一项艰巨的挑战是多么的困难。当然,在Marr的实验实现层面,老鼠和人的颜色辨别能力可能存在差异。但是在算法级别上,通常会默认一个假设,即类人的表现意味着类人的策略(或算法)。这种“相同的策略假设”同样存在于深度学习:即使DNN单元与生物神经元不同,但如果DNN成功识别出物体,那么似乎可以很自然地认为它们是像人类一样使用通过物体的形状来识别物体。因此,我们需要区分实验对象在一个数据集的性能表现与获取能力之间的联系,在将“物体识别”或“语言理解”等高级能力赋予机器之前,我们要非常谨慎,因为通常有一个更简单的解释:

可以归因于捷径学习时,切勿使用高级能力进行解释。

 

捷径学习需要我们改变基准测量的方式

 

从历史上看,机器学习研究主要由基准驱动,基准测试通过在任务和数据集的固定组合上对算法进行评估,使算法具有可比性。这种模式在很短的时间内就引领了该领域的巨大进步。但这并非没有缺点。一方面,它为研究人员提供了强大的动力,使其可以将精力更多地集中在改进现有基准的新颖算法的开发上,而不是了解他们的算法或基准。然而,这种对理解的忽视,恰恰让是让捷径学习成为深度学习中普遍存在问题的部分原因。

让我们看一个著名的例子:ImageNet 数据集和挑战赛创建于2009年,作为一种新的衡量对象识别进度、算法识别和分类对象能力的方法。由于ImageNet规模巨大,它本身是一个未解决的问题,没人胆敢挑战。它的多样性和规模为当前的深度学习革命铺平了道路。Krizhevsky等人2012年的论文和挑战赛的耀眼成绩证明了具有学习权重的深层神经网络可以用独特的方式处理这种复杂性(而不是当时普遍的手工调整图像分析方法)。在接下来的几年中,ImageNet成为ImageNet基准测试进步和性能提升的推动力,成为计算机视觉进步的代名词。

 

直到最近几年,随着越来越多的DNN失效案例的出现,这种情况才开始慢慢改变。所有这些失效案例背后的一个主要原因是,尽管ImageNet具有规模和多样性,但它并不需要真正的对象识别,从某种意义上说,模型必须正确地识别和分类我们用作标签的前景对象。相反,在许多情况下,对象的背景、纹理或其他对人类不太明显的捷径可以很好地被识别。如果比场景中的主要对象更容易识别背景,网络通常会学习利用这一点进行分类。

 

这种行为所引起的后果,是神经网络泛化能力的失败。下图左侧是人们期望模型进行泛化的几个方向。不管是手绘的黑白的还是彩色的门牌号,5都是5。同样,在姿态、纹理或背景上的轻微变形或变化也不会影响我们对图像中主要对象的预测。相比之下,DNN很容易被欺骗。有趣的是,这并不意味着DNN完全不能泛化:事实上,在对人类几乎没有意义的方向上,它们还是可以很好地泛化。下图的右侧显示了一些例子,从一些可理解的(置乱图像以仅保留其纹理)到完全不可理解。

 

导致捷径学习和随后的泛化失效的关键问题是我们对任务的理解与它实际上激发学习的模型之间的差异。我们如何减轻这个问题并提供对捷径学习的洞察力?当前大多数基准测试的主要缺点是,它们会测试训练集中相同数据分布的图像(iid测试)。这种类型的评估仅需要一种较弱的泛化形式。但是,我们需要强大的归纳能力,这些能力大致与我们的直觉相吻合。为了测试这些,我们需要良好的分布外测试(ood测试),这些测试应具有明显的分布变化,明确定义的预期解决方案,并提供模型学习捷径的节点。

 

但还不止于此:当模型变得越来越好时,它们会学习利用微妙的捷径,因此我们预测,基准测试也会越来越强。这种“滚动基准”可以确保我们在模型开发过程中不会失去对最初目标的跟踪,而会不断地将精力重新集中在解决我们真正关心的潜在问题上,同时加深我们对建模管道与模型之间相互作用的理解。

 

跨过捷径实现理解,该怎么做?

 

科学的目标就是理解。尽管深度学习作为一门工程学科在过去几年中取得了长足的进步,但深度理解作为一门科学学科,在理解控制机器学习如何从数据中提取模式的原理和局限性方面仍非常落后。更加深入地理解捷径学习不仅关乎当前机器学习的应用,未来还可能有助于跨学科研究,如与经济学(通过奖励意外的“捷径”行为来设计不会危及长期成功的管理激励措施)、法律(创建没有“漏洞”捷径机会的法律)交叉融合的机会。但是,必须指出,我们可能永远不会完全解决捷径学习。模型始终以减少的信息为基础来做出决策,因此泛化失败不可避免:受捷径学习影响而失败将会是常态,而不是意外。为了深入理解捷径学习,或减轻它的影响,我们有五个建议:

 

(1)连接点:捷径学习无处不在

 

捷径学习似乎是生物学和人工学习系统的普遍特征。深度学习中的许多问题都与捷径学习有关——模型利用数据集捷径机会,仅选择一些预测特征而不是仔细考虑所有可用证据,因此因各种原因失败。受影响区域之间的“连接点”很可能会促进发展,并且在各个应用场景中产生极有价值的影响。

 

(2)认真解读结果

 

发现捷径通常意味着,一个看似复杂的数据集可以用简单的方案解决。我们认为,在将诸如“对象识别”或“语言理解”之类的高级功能归因于机器之前,我们需要格外小心,因为通常会有更简单的解释。

 

(3)测试分布外的泛化表现

 

评估iid测试数据的模型性能(就像当前大多数基准测试一样)不足以区分预期的和意外的(捷径)解决方案。因此,分布外的测试是必须要做的。

 

(4)了解是什么让解决方案易于学习

 

DNN总是学习最简单的问题解决方案,但是要了解哪种解决方案更简单(从而容易学习),则需要弄清结构(体系结构)、经验(训练数据)、目标(损失函数)和学习(优化)的影响,以及对这些因素之间相互作用的透彻理解。

 

(5)首先弄清楚是否真的要解决这个问题

 

捷径的存在意味着,无论任务是否得到充分证实,DNN都会找到解决方案。例如,系统可能试图根据敏感的人口统计学(例如肤色或种族)或仅根据外表,用捷径来评估信用分数。这很令人担忧,因为当将机器学习用于不明确或有害的任务时,可能会强化错误的假设和有问题的关联。捷径方式可以使此类可疑任务看起来完美可解决。但是,DNN具有高性能处理任务或基准的能力永远无法证明任务的存在或潜在假设。因此,在评估一项任务是否可以解决时,我们首先需要问:是否真的要解决这个问题?如果答案是yes,、应该用AI来解决吗?

 

捷径学习是当前ML模型与人类智能之间最具标志性的差异。但具有讽刺意味的是,正是这种对“作弊”的偏爱,使神经网络看起来几乎和人类又相像了几分:谁还没有过在考试前偷懒背材料,而不是花时间去真正理解的经历?谁从来没有试图在一项法规中寻找漏洞,而不是坚持法律的精神?最后,神经网络也许和(懒惰的)人类并没有什么不同……

 

本观点基于以下论文:

 

Geirhos,R.,Jacobsen,JH,Michaelis,C.,Zemel,R.,Brendel,W.,Bethge,M.&Wichmann,FA(2020)。深度神经网络中的快捷学习。arXiv预印本arXiv:2004.07780。

 

作者简介

Dr.Jörn-HenrikJacobsen,图宾根大学博士后,在阿姆斯特丹大学获得博士学位,研究广泛涉猎学习有用的含义和世界的通用表示形式,特别关注分布外的概括,无监督表示学习,稳定性保证和算法偏差。

 

Robert Geirhos,德国马克斯·普朗克国际智能系统研究学院的博士,获得蒂宾根大学计算机科学专业硕士学位,专注于人类和计算机视觉研究。

 

Claudio Michaelis,国际马克斯·普朗克智能系统研究学院博士,获康斯坦茨大学硕士学位,兴趣领域为理解人工神经网络。

 

原文链接:

https://thegradient.pub/shortcuts-neural-networks-love-to-cheat/

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/486812.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2017-2018年Scrum状态调查报告

HOW SCRUM IS USED在2017年的报告中,Scrum的应用范围在扩大,已经从其发源的IT部门扩展到了相距甚远的业务部门。2017-2018年度报告的其中一个主要目标就是关注更广泛的敏捷转型,看看不同行业中影响Scrum企业应用及区域应用的细微差别。在这份…

麻省理工选出的全球十大突破性技术

来源:广东省创新孵化器运营研究院《麻省理工科技评论》每年都会评选出当年的“十大突破性技术”,这份在全球科技领域举足轻重的榜单,曾精准预测了脑机接口、智能手表、癌症基因疗法、深度学习等诸多热门技术的崛起。正如比尔盖茨所说&#xf…

从信息传递的视角看因果关系

来源:混沌巡洋舰因果推断让大数据更有温度在六种看待因果关系的视角(机制,反事实,干预,过程,信息传递及概率因果)中,信息传递是潜在应用最广泛的一种。当我们想弄清楚是什么导致某件…

springboot入门_模板

springboot中已经不推荐使用jsp,而是推荐使用模板,如freemarker,thymeleaf等,本文记录在sprigboot中使用模板。 创建一个maven的springboot工程, freemarker,要使用freemarker模板需引入所需要的jar&#x…

姚期智:当科学家发现自己喜欢探索的方向,整个世界会像打游戏一样愉悦

来源:上观新闻 作者:舒抒发现一个大定理的喜悦程度,和小时候吃第一口冰激凌、第一块巧克力是一样的。“走在滨江大道,能闻到江风吹来的桂花香。”夏秋交替之际来到上海,江风、江景和丹桂飘香,让姚期智在演讲…

imageloader图片基本加载

初始化&#xff1a; 配置初始化&#xff1a; <application android:name".Jiaimgapp"使用&#xff1a; http://blog.csdn.net/vipzjyno1/article/details/23206387 http://blog.csdn.net/vipzjyno1/article/details/23206387 http://blog.csdn.net/hudashi/ar…

刚获得物理诺奖的数学家:现实是对完美数学真理的扭曲反应,人脑是最终量子计算机!...

来源&#xff1a; 数学竞赛的那些事儿在20世纪中期&#xff0c;数学探究自然模式的能力被大大地增强了&#xff0c;如果那些远古的几何学者们看到这一切&#xff0c;必将大为惊愕甚至迷惑不解&#xff0c;在极为宏观的尺度上&#xff0c;天文学家们以整个银河系为基本单位&…

如何实时查看linux下的日志

如何实时查看linux下的日志 Unix/linux&#xff08;88&#xff09; cat /var/log/*.log 如果日志在更新&#xff0c;如何实时查看 tail -f /var/log/messages 还可以使用 watch -d -n 1 cat /var/log/messages -d表示高亮不同的地方&#xff0c;-n表示多少秒刷新一次。 该指令&…

2020年世界机器人报告

来源&#xff1a;国际机器人联合会最新的《2020年世界机器人报告》(The new World Robotics 2020 Industrial Robots)显示&#xff0c;在世界各地的工厂中运行的270万台工业机器人&#xff0c;创下纪录&#xff0c;增长了12&#xff05;。新机器人的销量保持较高水平&#xff0…

2020年诺贝尔化学奖得主自述:基因编辑技术将把我们带向何方?

来源&#xff1a;赛先生作者 ┃ Jennifer Doudna &#xff08;美国加州大学伯克利分校化学与分子和细胞生物学系教授&#xff09;翻译 ┃ 马宗敏制版编辑 | 栗子北京时间2020年10月7日下午&#xff0c;诺贝尔奖化学奖授予了基因编辑领域的两位先驱。加州大学伯克利分校教授詹妮…

使用travelbook架设自己的实时位置共享服务

travelbook 是一款开源的安卓APP&#xff0c;它能以低功耗提供实时位置共享&#xff0c;它包含功能如下&#xff1a; 好友之间分享实时位置&#xff1b;记录行程轨迹&#xff1b;标记收藏地点&#xff1b; 这款软件的主要解决的问题包括&#xff1a; 场景1&#xff1a;查看老…

揭秘:1.2亿美元光刻机内部视频曝光,像科幻片一样震撼!

来源&#xff1a;直观学机械 &#xff0c;转今日半导体荷兰阿斯麦&#xff08;ASML&#xff09;公司的光刻机作为世界上最贵最精密的仪器&#xff0c;相信大家都有耳闻&#xff0c;它是加工芯片的设备。其最先进的EUV&#xff08;极紫外光&#xff09;光刻机已经能够制造7nm以下…

树状数组-神奇的二进制

树状数组是解决快速更新以及统计数组某段区间总和&#xff0c;设一个数组A[1-N],需要计算A[M-K]的总和&#xff0c;暴力解法需要O(K-M)&#xff0c;如果我们求出sum&#xff08;1-K&#xff09;和sum&#xff08;1-M&#xff09;,那么答案就是sum(1-M)-sum(1-K); 那么如何快速求…

通往诺贝尔奖之路:盘点10个著名的科学家族

文章 | COLIN HUNTER来源 | 科研大匠科学家们常常将最亲近的合作者当做自己的亲人看待&#xff0c;而对于有些科学家而言&#xff0c;他们的合作者就是他们的家人。无论是由于遗传因素、教育因素还是二者的综合影响&#xff0c;那些开创性的物理学研究往往是一项家庭事业。从杰…

20165212 预备作业3 Linux安装及学习

20165212 预备作业3Linux安装及学习 Linux虚拟机的安装过程 我像大部分同学一样&#xff0c;通过助教学姐给的Ubuntu下载地址下载映像文件、VB&#xff0c;但是屡次出现问题&#xff0c;不停的闪出一下错误提示窗口&#xff1a;在像同学求助无果之后我使用VM、Ubuntu安装了Linu…

特斯拉公布的「新电池」,究竟要用在哪里?

来源丨ArsTechnica作者丨SCOTT K. JOHNSON编译丨科技行者在近期的“电池日&#xff08;battery day&#xff09;”活动上&#xff0c;特斯拉公司终于透露了其长期保密项目的一系列惊人消息——讨论了特斯拉为自家电池组做出的全方位升级与改进&#xff0c;并宣称有望在未来三年…

Python 程序 可以一直输入 quit_从零开始学Python - 第002课:第一个Python程序

在上一课中&#xff0c;我们已经了解了Python这门语言并安装了运行Python程序所需的环境&#xff0c;相信大家已经迫不及待的想开始自己的Python编程之旅了。首先我们来告诉大家在哪些地方可以写Python程序。编写代码的工具交互式环境我们打开Windows的“命令行提示符”工具&am…

清华张钹院士专刊文章:迈向第三代人工智能(全文收录)

来源&#xff1a;清华大学人工智能研究院作者&#xff1a;张钹、朱军、苏航在这篇评述文章中&#xff0c;清华大学人工智能研究院院长、中国科学院院士张钹教授阐述了自己对于「第三代人工智能」的看法。他认为&#xff0c;第三代 AI 发展的思路是把第一代的知识驱动和第二代的…

java 垂直走马灯多行,Android实现图文垂直跑马灯效果

最近在维护老项目&#xff0c;老项目有一个地方需要修改&#xff0c;就是垂直跑马灯的问题&#xff0c;之前的垂直跑马灯是只有文字跑马灯&#xff0c;新版需要加上。之前是用的MarqueeView&#xff0c;看了下源代码是只支持文字的&#xff0c;于是我就改了下原作者的源代码。M…

惠普打印机怎么无线连接电脑_惠普打印机连不上无线?怎么解!

打印机有无线功能&#xff0c;但却总连不上路由&#xff0c;看着高大上的功能用不上&#xff0c;是不是很捉急&#xff1f;今天总结了5种打印机连接无线的方法&#xff0c;总有一款适合你~- 方 1 法 -在打印机屏幕上配置无线本方法适用于带有无线网络功能且有可视面板屏幕的打印…