【综述专栏】神经网络的可解释性综述

来源:知乎

作者:知乎—机器学习小谈

地址:https://zhuanlan.zhihu.com/p/368755357

本文以 A Survey on Neural Network Interpretability 读后感为主,加上自身的补充,浅谈神经网络的可解释性。

论文:https://arxiv.org/abs/2012.14261

本文按照以下的章节进行组织:

  1. 人工智能可解释性的背景意义

  2. 神经网络可解释性的分类

  3. 总结


01

人工智能可解释性的背景意义

1.1 什么是可解释性

Interpretability (of a DNN) is the ability to provide explanations in understandable terms to a human. F Doshi-Velez & B Kim, 2017

  • 解释(Explanations),是指需要用某种语言来描述和注解

理想情况下,严谨的数学符号-逻辑规则是最好的解释(D Pedreschi et al., 2019)。实际上人们往往不强求“完整的解释”,只需要关键信息和一些先验知识

  • 可解释的边界(Explainable Boundary),是指可解释性能够提供解释的程度

来自XAI的:对于不同的听众,解释的深度也有所不同,应该是需求而定。例如:为什么你这么聪明?因为我喜欢吃鱼。为什么吃鱼会聪明?因为鱼类富含DHA。为什么DHA聪明?...... 因为根据不同的人群,我们的可解释的工作也不一样。例如给大众解释吃鱼能够聪明就行了,因为吃鱼能够聪明我们很多人已经从小到大耳熟能详了。如果我们给专业人士解释DHA为什么会是大脑聪明,我们身边很多人也答不出来,这已经远超出我们计算机这个领域了。当然,可解释的这种边界越深,这个模型的能力也越强。

  • 可理解的术语(Understandable Terms),是指构成解释的基本单元

不同领域的模型解释需要建立在不同的领域术语之上,不可能或者目前难以用数学逻辑符号来解释。例如计算机视觉中的image patches,NLP中的单词等。而可理解的术语可以理解为计算机跟我们人类能够沟通的语言。以前我们很多研究关于人类跟计算机表达的语言例如计算机指令,现在是反过来计算机根据现有的模型给我们解释

1.2 为什么需要可解释性

  • 高可靠性的要求

a)神经网络在实践中经常有难以预测的错误(进一步的研究是对抗样本攻击与防御),这对于要求可靠性较高的系统很危险

b)可解释性有助于发现潜在的错误;也可以通过debug而改进模型

  • 伦理/法规的要求

AI医疗:目前一般只作为辅助性的工具,是因为一个合格的医疗系统必须是透明的、可理解的、可解释的,可以获得医生和病人的信任。

司法决策:面对纷繁复杂的事实类型,除了法律条文,还需要融入社会常识、人文因素等。因此,AI在司法决策的事后,必须要给出法律依据和推理过程。

  • 作为其他科学研究的工具

科学研究可以发现新知识,可解释性正是用以揭示背后原理。


02

神经网络可解释性的分类

2.1 按照逻辑规则解释(Rule as Explanation)

图左是一颗关于判断西瓜好坏的决策树,经过DFS后,我们可以抽取出右图的规则。而对于神经网络,我们是否也可以类似决策树这样做呢?

答案是肯定的。

第一种方法是分解法,遍历所有特征的排列组合

分解法最简单,但是缺点也是显而易见的,就是时间复杂度太高,虽然KT算法有所优化,但是指数形式的复杂度还是难以投入实际使用。于是我们引入第二种方法:教育法[1]

DecText-决策树抽取器,主要采用经过黑箱子的数据来抽取黑箱子的规则,并且与其他决策树不同的是,该方法除了使用标记数据还可以使用未标记数据以及随机数据,只要经过神经网络黑箱子都可以获得标签。对比仅用训练集,由于传统决策树进行生成叶子比生成其根的可信度还要低(因为能用于划分界限的数据越来越少)。所以DecText有一个优势就是可以利用更多的无标记数据甚至随机数据进行补充。但是一般论文也不会提及到自身设计的大多数缺点。例如,这里我认为有两大缺点。一、无标记数据或者随机数据其实有很多是超过解释的意义,例如人脸识别,如果我们倒入一些不及格的人脸甚至随机的图像,决策树也会对这些图像进行开枝散叶,降低了真正解释人脸的枝叶的占比。二、决策树不能表达太深的网络,决策树越深,性能会急剧下降,可解释性也越差。

Tree Regulartion[2]提出了树正则的方法,来抑制了树的深度。

树正则通过引入深度损失正则项,在优化时候会抑制树的深度。而树的深度则是通过一个简单的预估网络进行预估,需要的参数就是主网络的参数。

2.2 按照语义进行解释

类比人类开始对细胞解释的时候,无法一下子直接从细胞本身理解这个细胞的类别或者功能,但是可以从细胞群或者组织(例如表皮细胞组织)来从宏观角度了解细胞的作用。神经网络亦是如此。例如卷积神经网络,浅层的卷积网络往往关注更基础的图像信息例如纹理、颜色等,而越往上层则越能抽象出更丰富的语义,例如人脸识别的眼睛、鼻子等。其中经典代表就是计算机视觉中的经典方法-可视化[3]

可视化的方法非常多,比如说有一个华人的博士就可视化了CNN,把每一层都展示得非常清楚,只需要在网页上点击对于的神经元,就可以看到工作流程。右边是一位维也纳的小哥,本来搞unity3D特效开发的,他把整个CNN网络用3d的形式可视化了出来。

cnn_visual

featuremap_layout

另外一种主动的按照语义进行解释的代表作:可解释卷积神经网络[4](Interpretable convolutional neural networks.)与传统的卷积神经网络不同的是,ICNN的每一个卷积核尽量只代表一种概念,例如,传统的卷积核对猫的头或者脚都有较大的激活值,而ICNN只能选择最大的一种。

2.3 通过示例解释

这种方法容易理解,是一种直观方法:寻找和待解释的样本最“相似”的一个训练样本,典型的代表作 Understanding black-box predictions via inflfluence functions,[5]

2.4 按照属性解释

按照属性解释目前内容上最。如前面提及到,决策树等透明模型难以模仿复杂的神经网络,那怎么解决呢?针对此问题研究的代表作有:Why should i trust you?: Explaining the predictions of any classififier[6]

由于LIME不介入模型的内部,需要不断的扰动样本特征,这里所谓的样本特征就是指图片中一个一个的像素了。但如果LIME采样的特征空间太大的话,效率会非常低,而一张普通图片的像素少说也有上万个。若直接把每个像素视为一个特征,采样的空间过于庞大,严重影响效率;如果少采样一些,最终效果又会比较差。所以针对图像任务使用LIME时还需要一些特别的技巧,也就是考虑图像的空间相关和连续的特性。不考虑一些极小特例的情况下,图片中的物体一般都是由一个或几个连续的像素块构成,所谓像素块是指具有相似纹理、颜色、亮度等特征的相邻像素构成的有一定视觉意义的不规则像素块,我们称之为超像素。

下面提供一些主动干预型的方法,如Dual-net[7]

其他的还有:用意想空间的对话系统[8]

这种解释的类型是最有深度而且也是用户最容易理解的。但是对AI模型和训练难度也更高了。目前这方面的研究屈指可数。


03

可解释性总结

参考

1.“Extracting Decision Trees From TrainedNeural Networks”. SIGKDD. July 23-26,2002 https://dl.acm.org/doi/10.1145/775047.775113

2.M. Wu, S. Parbhoo, M. C. Hughes, R.Kindle, L. A. Celi, M. Zazzi, V. Roth, and F. Doshi-Velez, “Regional treeregularization for interpretability in deep neural networks.” in AAAI, 2020,pp. 6413–6421. https://arxiv.org/abs/1908.04494

3.K. Simonyan, A. Vedaldi, and A.Zisserman, “Deep inside convolutional networks: Visualising imageclassification models and saliency maps,” arXiv preprint arXiv:1312.6034, 2013.

4.Q. Zhang, Y. Nian Wu, and S.-C. Zhu, “Interpretable convolutional neural networks,” in Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2018.

5.P. W. Koh and P. Liang, “Understanding black-box predictions via influence functions,” in Proceedings of the 34th International Conference on Machine Learning-Volume 70, 2017.

6.M. T. Ribeiro, S. Singh, and C. Guestrin, “Why should i trust you?: Explaining the predictions of any classifier,” in Proceedings of the 22nd ACM SIGKDD international conference on knowledge discovery and data mining, 2016.

7.M. Wojtas and K. Chen, “Feature importance ranking for deep learning,” Advances in Neural Information Processing Systems, vol. 33, 2020.

8.Open Domain Dialogue Generation with Latent Images Z Yang, W Wu, H Hu, C Xu, Z Li - arXiv preprint arXiv:2004.01981, 2020 - arxiv.org https://arxiv.org/abs/2004.01981

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/484738.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

吴军:既能得诺贝尔奖,又能生产高科技产品,美国的科研机制是如何运行的?...

来源:大数据文摘范内瓦布什(Vannevar Bush)一生大部分时间供职于麻省理工学院,是这所世界排名第一的理工科大学最引以为傲的人之一。2016年,我访问麻省理工的媒体实验室。由于我到的时间早了一点,伊藤主任还…

机器学习核心概念完全解析(建议收藏)

来源:机器学习研究组订阅刚接触机器学习框架 TensorFlow 的新手们,这篇由 Google 官方出品的常用术语词汇表,一定是你必不可少的入门资料!本术语表列出了基本的机器学习术语和 TensorFlow 专用术语的定义,希望能帮助您…

科学研究发现:说谎,是儿童成长的里程碑

来源:心灵成长家园(ID:xinling_JY)科学研究发现:说谎,是儿童成长的里程碑。和成年人的谎言不同,小朋友的谎言,是他们获得一类重要心智能力的标志。许多研究发现,越早学会…

非 GUI 模式运行 JMeter 压力测试

非 GUI 模式&#xff0c;即命令行模式&#xff0c;运行 JMeter 测试脚本能够大大缩减所需要的系统资源。 使用命令&#xff1a;jmeter -n -t <testplan filename> -l <listener filename> -n&#xff1a;非GUI模式 -t&#xff1a;需要执行的脚本文件名&#xff0c;…

第一章 计算机系统概述 1.2.1 计算机硬件的基本组成 [计算机组成原理笔记]

第一章 计算机系统概述 1.2.1 计算机硬件的基本组成 本笔记参考书目&#xff1a; 计算机组成原理&#xff08;第六版.立体化教材&#xff09;白中英、戴志涛2021王道计算机组成原理视频公开课 本节重点&#xff1a; 冯诺依曼机结构现代计算机结构 转载请注明文章来源&#…

2021年中国人工智能产业发展趋势

来源&#xff1a;专知、图灵人工智能人工智能作为新一轮产业变革的核心驱动力&#xff0c;正在释放历次科技革命和产业变革的巨大能量。持续探索新一代人工智能应用场景&#xff0c;将重构生产、分配、交换、消费等经济活动各环节&#xff0c;催生 新技术、新产品、新产业。作为…

第一章 计算机系统概述 1.2.2 各硬件部分的介绍 [计算机组成原理笔记]

第一章 计算机系统概述 1.2.2 各硬件部分的介绍 本笔记参考书目&#xff1a; 计算机组成原理&#xff08;第六版.立体化教材&#xff09;白中英、戴志涛2021王道计算机组成原理视频公开课 本节重点&#xff1a; 主存储器、运算器和控制器的基本组成计算机运行过程的实例 转…

GAN网络立功!36分钟,建起5亿光年的宇宙区域

来源&#xff1a;simonsfoundation编译&#xff1a;周熙利用神经网络&#xff0c;Flatiron研究所的研究员Yin Li和他的同事只花费了传统方法所需时间千分之一&#xff0c;就成功模拟了庞大而复杂的宇宙。该方法提出者在5月4日在线发表于《美国国家科学院院刊》的一项研究中报告…

STM32F407 开发环境搭建 程序下载 个人笔记

详细资料&#xff1a; http://www.openedv.com/thread-13912-1-1.html 需要安装的软件&#xff1a; 1.keil&#xff08;MDK&#xff0c;必选&#xff09;&#xff0c;用keygen破解 2.CH340驱动&#xff0c;&#xff08;usb串口驱动&#xff0c;用来下载程序。方便但下载速度较慢…

第一章 计算机系统概述 1.2.3 计算机的多级层次结构 [计算机组成原理笔记]

第一章 计算机系统概述 1.2.3 计算机的多级层次结构 本笔记参考书目&#xff1a; 计算机组成原理&#xff08;第六版.立体化教材&#xff09;白中英、戴志涛2021王道计算机组成原理视频公开课 本节重点&#xff1a; 计算机系统的五层结构&#xff1a;微程序机器、传统机器、…

从多维度解析神经科学中的视觉编码

来源&#xff1a;脑人言一棵树是如何被知觉为“一棵树”&#xff1f;我又是如何认出你是“你”&#xff1f;我们可能会说这很大程度依赖于我们的视觉感知。以后者为例&#xff0c;从你身上反射的光将你的信息传入我眼&#xff0c;当抵达视网膜感受器时&#xff0c;光转换为携带…

突发!美国最大输油管道遭网络攻击关闭!美媒:为其基础设施的脆弱堪忧

来源&#xff1a;雷锋网&#xff08;leiphone-sz&#xff09;作者&#xff1a;代润泽“这不仅是一条输油管道&#xff0c;可以说已经接近美国基础设施的大动脉。”你能想象&#xff0c;美国最大的燃油管道运营商能因为网络攻击被迫停运&#xff01;CNN网站消息&#xff0c;当地…

第一章 计算机系统概述 1.3 计算机的性能指标 [计算机组成原理笔记]

第一章 计算机系统概述 1.3 计算机的性能指标 本笔记参考书目&#xff1a; 计算机组成原理&#xff08;第六版.立体化教材&#xff09;白中英、戴志涛2021王道计算机组成原理视频公开课 本节重点&#xff1a; 容量计算K/M/G/T单位转换CPU主频/CPI/IPS/FLOPS数据通路带宽/吞吐…

机器学习漫谈:还有很长的路要走

来源&#xff1a;王宏琳科学网博客链接地址&#xff1a;http://blog.sciencenet.cn/blog-3005681-1285948.html 人工智能已经成为大数据、机器人和物联网等新兴技术的主要驱动力&#xff0c;在可预见的未来&#xff0c;它将继续驱动技术创新&#xff0c;影响着几乎每个行业和每…

第一章 计算机网络 1 计网体系结构的概念和功能 [计算机网络笔记]

第一章 计算机网络 1 计网体系结构的概念和功能 本笔记参考书目&#xff1a; 计算机网络&#xff08;第8版&#xff09;谢希仁2021王道计算机网络视频公开课 本节重点&#xff1a; 因特网的三个发展阶段 转载请注明文章来源&#xff01; ——计算机网络的分层结构是类&…

第一章 计算机网络 2 组成与分类 [计算机网络笔记]

第一章 计算机网络 2 组成与分类 本笔记参考书目&#xff1a; 计算机网络&#xff08;第8版&#xff09;谢希仁2021王道计算机网络视频公开课 本节重点&#xff1a; 计网的组成与分类 转载请注明文章来源&#xff01; 计算机网络的组成 组成部分 &#xff1a; 硬件、软件、…

企业——Docker容器的搭建及简单应用

1.环境需求 不需要开虚拟机&#xff0c;只需要一个真机就行。 下载docker的安装包&#xff0c;可以在官网上下载 www.docker.com yum install -y pigz-2.3.4-1.el7.x86_64.rpm docker-ce-18.03.1.ce-1.el7.centos.x86_64.rpm container-selinux-2.21-1.el7.noarch.rpm   …

第一章 计算机网络 3 标准化工作和相关组织 [计算机网络笔记] -简单浏览了解即可

第一章 计算机网络 3 标准化工作和相关组织 本笔记参考书目&#xff1a; 计算机网络&#xff08;第8版&#xff09;谢希仁2021王道计算机网络视频公开课 本节重点&#xff1a; 标准化工作和相关组织 转载请注明文章来源&#xff01; 标准化分类 标准化流程 标准化相关组织 …

张亚勤、韦乐平等综述论文:通信人工智能的下一个十年

来源&#xff1a;专知【摘 要】移动通信技术走过了37年的发展历程&#xff0c;人工智能技术也已走过了64年的发展历程。从早期的各自独立演进&#xff0c;到5G与人工智能开始深度融合发展&#xff0c;“5G与人工智能”已被业界视为一组最新的通用目的技术组合&#xff0c;对垂…

Juventas, the Roman Goddess of Youth [ Juventas, 罗马青春女神]

Juventas, the Roman Goddess of Youth &#x1f478; Juventas, 罗马青春女神——尤文图斯 Introduction Juventas was a minor Roman goddess whose attributes were regarded by the Romans as applying particularly to the imperishable vigour and immortal glory of t…