Nature长文:打破AI黑盒的“持久战”

2e683aae34172b47a461d169c1a17578.png

来源:大数据文摘

2020年2月,随着 COVID-19在全球迅速传播且抗原检测难以获得,一些医生转向人工智能(AI)来尝试诊断病例。一些研究人员采用深度神经网络通过查看X射线和胸部计算机断层扫描(CT)扫描来快速区分患有COVID-19肺炎的人和未患肺炎的人。

“在COVID-19大流行的早期,人们竞相构建工具,尤其是AI工具来提供帮助”,西雅图华盛顿大学的计算机工程师Alex DeGrave说,“但研究人员并没有注意到许多人工智能模型已经决定走一些捷径” 。

AI通过分析被标记为COVID-19阳性和阴性的X射线图片来训练模型,然后利用它们在图像之间发现的差异性来进行推断,但是在当时面临着一个问题,“可用的训练数据并不多。”DeGrave说。

多家医院公开了COVID-19患者的X射线照片(被标记为COVID-19阳性),美国国立卫生研究院在大流行之前收集的肺部图像库提供了未感染COVID-19的X射线数据(被标记为COVID-19阴性),这些数据在被用作训练时存在无法忽视的误作用,例如,许多X射线会使用字母R来标记一个人身体右侧,从而方便放射科医生正确定位图像与人体的关系,但是不同医院采用的字母R的外观不同,同时,大多数COVID-19阴性图片来源单一,这使得最终使用这些数据训练的模型不仅会根据照片上显示的生物特征进行推断,还会根据图片上字母R的风格与位置进行推断(如图1所示)。

daf9b9eb4d75f5eec8d9da2c078167dd.png

图1 用作训练的X射线图片

DeGrave和 Joseph Janizek 都是计算机科学家Su-In Lee位于西雅图的生物和医学科学可解释AI实验室的成员,他们于2021年5月在《Nature Machine Intelligence》上发表了一篇论文,报告了前文所述问题。

机器学习模型的决策过程通常被学者称为黑匣子,因为研究人员通常只知道模型的输入和输出,但很难看到模型里面究竟发生了什么。

DeGrave和Janizek 使用旨在测试AI系统并解释它们为什么这样做的技术来打开这些黑盒子,即构建可解释的AI模型。

构建可解释的AI(eXplainable AI,XAI)有很多优势,在医疗环境中,了解模型系统做出特定诊断的原因有助于让病理学家相信它是合法的,因为在某些情况下,法律要求做出解释。例如,当一个贷款系统就用户贷款资格做出决定时,美国和欧盟都要求提供证据,证明拒绝信贷不是出于法律禁止的原因(例如种族或性别)。

深入了解AI系统的内部工作原理还可以帮助计算机科学家改进和完善他们创建的模型,甚至可能会带来关于如何解决某些问题的新想法。

然而,只有当XAI给出的解释本身是可理解和可验证的,并且构建模型的人认为这是值得的努力时,XAI的好处才能实现。

神经元

DeGrave和Janizek研究的深度神经网络因其不可思议的能力而广受欢迎,因为它们能够通过曝光来了解照片中的内容、口语的含义等等。

这些神经网络的工作方式与人脑相似,就像某些活性神经细胞响应外部刺激从而以某种模式发射一样。例如,神经网络中的人工神经元会在他们收到的输入的基础之上,当看到一只猫时会触发与看到一棵树不同的模式,即神经元会寻找到二者之间的差异性。

在这种情况下,神经元是数学函数,输入数据以数字形式进入系统。例如描述照片中像素的颜色,然后神经元对该数据执行计算。在人体中,神经元只有在收到的刺激超过某个电阈值时才会发出信号。类似地,人工神经网络中的每个数学神经元都用一个阈值加权。

如果计算结果超过该阈值,则将其传递给另一层神经元进行进一步计算。最终,系统会学习到输出数据与输入数据之间关系的统计模式。例如,被标记为有猫的图像将与那些标记为没有猫的图像存在系统差异,然后这些明显的差异可以帮助AI模型在其他图像中确定猫存在的可能性。

神经网络的设计与其他机器学习技术存在差异。

神经网络模型作用于输入的计算层(即hidden layer)越多,解释模型在做什么的难度就越大。马萨诸塞州波士顿大学的计算机科学家Kate Saenko说,“简单的模型,例如小型决策树并不是真正的黑匣子。小型决策树‘基本上是一组规则’,人类可以很容易地理解该模型在做什么,因此它本质上是可解释的。然而,深度神经网络通常过于复杂,一个神经网络涉及数百万计算,或者现在更可能是数十亿计算,学者们很难对其内在工作机理进行解释”。

一般来说,解释深度神经网络神秘工作原理的工作涉及到找出输入数据的哪些特征会影响输出结果。

帮助DeGrave和Janizek确定胸部 X 射线图片上的方向标记(字母R)影响诊断的一种工具是显着性图(Saliency Map),这是一种用颜色编码的图表,显示计算机在推断时最关注图像的哪一部分。如图2所示。

Saenko 和她的同事开发了一种称为D-RISE(用于解释AI的检测器随机输入采样)的技术来生成此类映射。研究人员拍摄了一张照片,例如,一个装满鲜花的花瓶(图2),并系统地屏蔽了图像的不同部分,然后将其展示给负责识别特定对象(例如花瓶)的AI模型。然后,他们记录每组像素的模糊程度如何影响结果的准确性,并根据每个部分对识别过程的重要性对整张照片进行颜色编码。

不出所料,在一张装满鲜花的花瓶的照片中,花瓶本身被明亮的红色和黄色照亮,这表明AI识别花瓶时,花瓶本身的存在很重要。但这并不是图片中唯一突出显示的区域。“显着性一直延伸到一束鲜花,”Saenko说,“它们没有被标记为花瓶的一部分,但模型了解到,如果你看到鲜花,这个物体更有可能是花瓶。”D-RISE突出强调了会导致 AI 模型改变其结果的因素。

“这有助于了解他们可能犯了什么错误,或者他们是否出于错误的原因做某事,”Saenko说,他在该领域的工作部分由美国国防高级研究中心运营的现已完成的XAI项目资助。

更改输入数据以识别重要特征是探究许多AI模型的基本方法。

但宾夕法尼亚州匹兹堡卡内基梅隆大学的计算机科学家Anupam Datta表示,这项任务在更复杂的神经网络中变得更具挑战性,在这些复杂的情况下,科学家们不仅要弄清楚哪些特征在模型推断中发挥作用以及这个作用效果有多大,而且还要弄清楚一个特征的重要性如何随着其他特征的变化而变化。

“因果关系仍然存在,因为我们仍在试图找出哪些特征对模型的预测具有最高的因果影响,” Datta说,“但测量它的机制会发生一点变化。”,与Saenko的显着性图一样,Datta系统地屏蔽了图像中的单个像素,然后为图像的该部分像素分配一个数学值,表示由于遮挡该部分而导致的变化幅度。看

到哪些像素是最重要的,可以告诉Datta隐藏层中的哪些神经元在结果中的作用最大,从而帮助他更好地解释模型工作原理。

可解释性的好处

DeGrave和Janizek通过另一种复杂神经网络来测量显著性图,这种网络叫做生成对抗网络(generative adversarial network,GAN)。

典型GAN由一对网络组成,一个负责生成数据(如街道的图像),另一个尝试确定该输出是真实还是虚假的。这两个网络不停地以这种方式交互,直到第一个网络可靠地创建能够欺骗另一网络的图像。在他们的案例中,研究人员要求GAN将COVID-19阳性X射线突变转为COVID-19阴性图片,通过查看GAN修改了X射线图片的哪些方面,研究人员可以确定图片的哪一部分对AI模型产生了作用,从而增加模型可解释性。

尽管GAN原理简单,但研究人员对这对网络的微妙动态改变还不是很清楚。“GAN生成图像的方式很神秘,给定一个随机输入的数字,GAN最终会输出一张看起来很真实的图片”,计算机科学家Antonio Torralba说。Torralba和他的团队负责剖析GAN,查看GAN的每个神经元到底在做什么,就像Datta一样,他们发现GAN中一些神经元会特别专注于某些特定概念。“我们找到了负责绘制树木的神经元组,负责绘制建筑物的神经元组以及绘制门窗的神经元”,Torralba说。

8b6afec03c5f003ccbd923ed6b35fdc6.png

图2 显著性图示例(图中指出AI在识别花瓶时也注意到了花瓶中的花朵)

Torralba说,能够识别出哪些神经元正在识别或产生哪些物体,这为改进神经网络提供了可能性,而无需向其展示数千张新照片。

如果一个模型已经被训练来识别汽车,但它所训练的所有图像都是铺砌路面上的汽车,那么当展示一张雪地上的汽车图片时,模型可能会无法识别该车。但是了解模型内部连接的计算机科学家能够调整模型以识别一层雪,使其相当于铺砌的表面,从而提高模型识别该类型图片的准确率。类似地,可能想要自动创建不可能的场景的计算机特效设计师可以手动重新设计模型来实现这一点。

可解释性的另一个价值是了解机器执行任务的方式可以让使用模型的人了解模型如何以不同的方式做事,并修改模型做其得更好。

计算生物学家 Laura-Jayne Gardiner 训练了一个AI来预测哪些基因在调节生物钟(控制一系列生物过程的内部分子计时器)中起作用。Gardiner和她在IBM Research Europe和英国诺里奇生命科学研究小组Earlham Institute的同事也让计算机突出了它用来决定基因是否可能在昼夜节律中发挥作用的特征。

“我们只关注基因调控的启动子,”加德纳说,“但AI在基因序列中发现了研究人员会忽略的线索”,加德纳解释说;该团队可以在实验室的研究中使用AI来进一步完善其对生物学的理解。

AI准确性和可信度

卡内基梅隆大学的计算机科学家 Pradeep Ravikumar 说,解释AI是一个开始,但也应该有一种方法来量化它们的准确性,他正在研究自动化这种评估的方法,他认为对人类来说似乎有意义的解释实际上可能与模型实际在做什么几乎没有关系。

“如何客观评估解释AI这一问题仍处于早期阶段,”Ravikumar 说,“我们需要得到更好的解释,也需要更好的方法来评估解释。”,测试解释真实性的一种方法是对它所说的重要特征进行小的改动。

如果解释正确,那么输入的这些微小变化应该会导致输出的巨大变化。样,对不相关特征的大改动,比如,从猫的照片中删除一辆公共汽车,应该不应该影响模型判断结果。如果更进一步评估AI,不仅可以预测哪些特征很重要,还可以预测如果对这些特征进行微小更改,模型的推测判断结果将如何变化。“如果一个解释实际上是在解释模型,那么它就会更好地了解模型在这些微小变化下的表现”Ravikumar 说。

解释AI内在工作原理有时看起来像是一项繁重的工作,以至于许多计算机科学家可能会想跳过它,并从表面上看待AI的结果。但至少某种程度的可解释性相对简单,例如,显着性图现在可以快速且廉价地生成,相比之下,训练和使用GAN更加复杂和耗时。

“你肯定必须非常熟悉深度学习的东西,以及一台带有一些图形处理单元的好机器才能让它工作,”Janizek 说。他的团队尝试的第三种方法——使用照片编辑软件手动修改数百张图像以确定某项特征是否重要——甚至更加耗费人力。

机器学习社区的许多研究人员也倾向于在模型可解释性和准确性之间进行权衡。他们认为,庞大的计算量使得神经网络输出更准确,也使它们超出了人类的理解范围。但有些人质疑这种权衡是否真实,Janizek 说。“最终可能会出现这样的情况,即一个更可解释的模型是一个更有用的模型和一个更准确的模型。”

Ravikumar 说,无论可解释性的挑战是大是小,一个好的解释并不总是足以说服用户依赖一个系统,知道为什么人工智能助手(例如亚马逊的 Alexa)以某种方式回答问题可能不会像禁止滥用私人对话记录的法律那样促进用户之间的信任,也许医生需要临床证据证明计算机的诊断随着时间的推移证明是正确的。政策制定者可能会要求将有关使用此类系统的一些保护措施写入法律。

然而,在解释领域,人工智能研究人员已经取得了长足的进步。Torralba 说,尽管可能仍有一些细节需要制定以涵盖正在使用的各种机器学习模型,但这个问题可能会在一两年内得到解决。

他说,“人们总是谈论这个黑匣子,我们不认为神经网络是黑匣子。如果他们工作得非常好,那么如果你仔细观察,他们所做的事情是有道理的。”

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

f44166059fe6de6977709981fb092fb3.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/482248.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

12 操作系统第三章 内存管理 非连续分配管理方式 基本分页存储管理 基本分段存储管理 段页式存储管理

文章目录1 基本分页存储管理1.1 什么是分页存储1.2 重要的数据结构——页表1.3 基本地址变换机构1.4 具有快表的地址变换机构1.4.1 什么是快表(TLB)1.4.2 引入快表后,地址的变换过程1.4.3 地址变换过程小结1.5 两级页表1.5.1 单级页表存在的问…

13 操作系统第三章 内存管理 虚拟内存 请求分页管理方式 页面置换算法 页面分配策略

文章目录1 虚拟内存1.1 传统存储管理方式的特征、缺点1.2 局部性原理1.3 虚拟内存主要特征1.4 如何实现虚拟内存技术1.5 虚拟内存的基本概念小结2 请求分页管理方式2.1 页表机制2.2 缺页中断机构2.3 地址变换机构2.4 请求分页管理方式小结3 页面置换算法3.1 最佳置换算法 OPT3.…

视觉意识的主动推理模型

来源:CreateAMind论文介绍:在这里,我们旨在通过推进全球神经元工作区的扩展(预测性全球神经元工作区(PGNW))来克服这些限制,该工作区将 GNW 的基本方面与更近期的(贝叶斯)主动推理方法相结合,以理解大脑功能。具体来说,我们提出了一个基于主动推理的视觉…

14 操作系统第四章 文件管理 文件逻辑结构 文件目录结构

文章目录1 初识文件管理1.1文件属性1.2 文件内部的数据应该怎样组织起来?1.3 文件之间应该怎样组织起来?1.4 操作系统应该向上提供哪些功能?1.5 文件应如何存放在外存?1.6 文件系统总览2 文件逻辑结构2.1 文件分类2.2 顺序文件2.3…

AlphaFold 和 AI 蛋白质折叠革命的下一步是什么

来源:ScienceAI编辑:萝卜皮十多年来,分子生物学家 Martin Beck 团队一直在努力拼凑世界上最难的拼图游戏之一:人类细胞中最大分子机器的详细模型。这种被称为核孔复合体的庞然大物控制着分子进出细胞核的流动,也就是基…

15 操作系统第四章 文件管理 文件的物理结构 文件存储空间管理

文章目录1 文件的物理结构 (文件分配方式)1.1 文件块、磁盘块1.2 文件分配方式——连续分配1.3 文件分配方式——链接分配1.3.1 链接分配——隐式链接1.3.2 链接分配——显式链接1.3.3 链接分配(总结)1.4 文件分配方式——索引分配…

专访微软Greg Yang,构建神经网络的底层语言,探索AI的“万物理论”

来源:智源社区为了进一步解读这一工作背后的意义,智源社区采访了论文一作、微软研究院高级研究员Greg Yang(杨格)。采访中,我们不仅了解了Transfer的背景,以及项目背后更为远大的目标,也了解到了…

16 操作系统第四章 文件管理 文件的基本操作 文件共享 文件保护 文件系统的层次结构

文章目录1 文件的基本操作1.1 创建文件1.2 删除文件1.3 打开文件1.4 关闭文件1.5 读文件1.6 写文件1.7 文件基本操作小结2 文件共享2.1 基于索引结点的共享方式(硬链接)2.2 基于符号链的共享方式(软链接)2.3 文件共享小结3 文件保…

人工智能与量子计算在有前途的新忆阻器中融合

来源:ScienceAI编辑:萝卜皮近年来,计算在两个主要方面取得了进步——机器学习方面的突破,以开发通过经验自动改进的算法,以及对理论上证明比任何超级计算机更强大的量子计算机的研究。现在,科学家们已经创建…

17 操作系统第四章 磁盘管理 磁盘的结构 磁盘调度算法 减少磁盘延迟时间的方法

文章目录1 磁盘的结构1.1 磁盘、磁道、扇区1.2 磁盘如何读取数据1.4 盘面、柱面、磁盘的物理地址1.5 磁盘的分类1.6 磁盘的结构小结2 磁盘调度算法2.1 一次磁盘读/写操作需要的时间2.2 先来先服务算法(FCFS)2.3 最短寻找时间优先(SSTF&#x…

深度学习准备「爆破」著名的欧拉方程

来源:ScienceAI编辑:绿萝250 多年来,数学家一直试图「爆破」物理学中一些最重要的方程:那些描述流体如何流动的方程。如果他们成功了,那么他们将会发现一种情况,在这种情况下,这些方程会被打破—…

18 操作系统第五章 设备管理 IO设备的基本概念和分类 IO控制器 IO控制方式 IO软件层次结构 IO核心子系统 假脱机技术 设备的分配与回收 缓冲区管理

文章目录1 IO设备的基本概念和分类1.1 什么是I/O设备1.2 I/O设备分类2 IO控制器2.1 I/O设备组成2.2 I/O控制器功能2.3 I/O控制器的组成2.4 寄存器编址方式2.5 IO控制器小结3 IO控制方式3.1 程序直接控制方式3.2 中断驱动方式3.3 DMA方式3.3.1 DMA控制器3.3.2 DMA方式3.4 通道控…

Nature发布第一张人类造血干细胞发育的全面路线图

来源:生物通加州大学洛杉矶分校(UCLA)的科学家创建了一份史无前例的路线图,追踪了人类胚胎中造血干细胞发育的每一步,为人们在实验室中生产功能齐全的造血干细胞提供了蓝图。来自胚胎主动脉壁的人类造血干细胞这项研究…

1 计算机组成原理第一章 计算机系统概述 计算机发展历程、层次结构、性能指标

文章目录1 计算机发展历程1.1 软硬件发展1.2 分类以及发展方向2 计算机系统层次结构2.1 计算机系统组成2.1.1 硬件的基本组成2.1.2 软件系统2. 2 CPU及其工作过程2.2.1 运算器2.2.2 控制器2.2.3 计算机的工作过程2.2.4 计算机系统层次结构2.2.5 存储器3 计算机性能指标3.1 容量…

Google 与 GitHub 结盟,为保护软件供应链而战!

出品:CSDN(ID:CSDNnews)整理:章雨铭 责编:屠敏4月7日,据谷歌透露,它一直在跟GitHub合作,创建一种防伪方法,用于签署源代码,解决像影响Solar…

5 计算机组成原理第四章 指令系统

文章目录1 指令格式1.1 指令定义1.2 指令格式1.3 指令格式-地址码1.4 指令格式-操作码1.5 操作码分类1.6 操作类型2 数据存放指令寻址2.1 数据存放方式2.2 指令寻址2.3 操作数类型2.4 数据寻址2.4.1立即寻址2.4.2 直接寻址2.4.3 间接寻址2.4.4 寄存器寻址2.4.5 寄存器间接寻址2…

【Brain】脑智前沿科普|用数学解释大脑学习的过程

来源:脑与心智毕生发展研究中心原文作者:Kate Nussenbaum,Alexandra O. Cohen原文编辑:David Sheinberg小小评阅人:Brown University Pre-College Stem I Program中文翻译版权:脑与心智毕生发展研究中心中文…

6 计算机组成原理第五章 中央处理器 CPU功能和结构 指令执行过程

文章目录1 CPU功能和基本结构1.1 CPU的功能1.2 运算器的基本结构1.3 控制器的基本结构1.4 CPU基本结构1.5 CPU的功能和基本结构小结2 指令周期和数据流2.1 指令执行过程2.2 指令周期流程2.3 指令周期的数据流-取指周期2.4 指令周期的数据流-间址周期2.5 指令周期的数据流-执行周…

7 计算机组成原理第五章 中央处理器 数据通路

文章目录1 数据通路的功能和基本结构单总线1.1 数据通路的功能1.2 数据通路-基本结构单总线2 数据通路-CPU内部单总线方式2.1 三种结构之间数据传送方式2.2 CPU内部单总线方式-例题3 专用通路3.1 专用数据通路方式3.2 专用数据通路方式-例题1 数据通路的功能和基本结构单总线 …

新研究表明 深层神经网络的功能存在局限性

GETTY IMAGES/IEEE SPECTRUM来源:IEEE电气电子工程师深度神经网络越来越有助于设计微芯片,预测蛋白质如何折叠,并在复杂游戏中胜过人们。然而,研究人员现在发现,这些人工智能系统的稳定性和准确度在理论上存在根本的限…