论文解读 | NeurIPS2023:「解释一切」图像概念解释器

点击蓝字

fb6cfac3f7864dde9cb45928a155a1bc.jpeg

关注我们

AI TIME欢迎每一位AI爱好者的加入!

1178b470f3e8ee16e31b6e22d10eab07.jpeg

讲者简介

孙奥:

香港科技大学软件安全实验室在读博士,研究兴趣为可解释性人工智能和可信机器学习,主要是从Post-hoc,逻辑和概念的角度分析神经网络的机理

Title


「解释一切」图像概念解释器

Content

内容简介

可解释AI(XAI)是提高人类对深度神经网络(DNN)理解给定黑盒内部的重要主题。对于计算机视觉任务,主流的基于像素的XAI方法通过识别重要像素来解释DNN决策,新兴的基于概念的XAI探索用概念形成解释。然而,像素通常很难解释和敏感XAI方法的不精确性,而先前工作中的“概念”需要人工注释或仅限于预定义的概念集。另一方面,由大规模预训练驱动, Segment Anything Model(SAM)已被证明是执行精确和全面的实例分割的强大且可扩展的框架,从而能够从给定的图像中自动准备概念集。本文首次探索了使用SAM来增强基于概念的XAI。我们提出了一种有效的灵活的基于概念的解释方法,即解释任何概念(EAC),它用任何概念解释DNN决策。虽然SAM非常有效并提供“开箱即用”实例分割,但在集成到事实上的XAI方法中时成本很高。因此,我们提出了一种轻量级的每个输入等效(PIE)方案,从而能够使用代理模型进行有效的解释。我们对两个流行数据集(ImageNet和COCO)的评估说明了EAC相对于常用XAI方法具有更好的性能。

个人主页:
https://jerry00917.github.io

论文链接:
https://openreview.net/pdf?id=X6TBBsz9qi

代码链接:
https://github.com/Jerry00917/samshap

Background

随着深度学习模型的崛起,越来越多的网络被提出,像Resnet、DenseNet等的黑箱模型越来越普遍,并且网络预测的准确率很高,但是其中的可解释性问题仍然是一个难题。

e8b764844176594c804f8c02c81265d9.png


如下图,之前的工作中大致可以分为两类。第一类是SuperPixel-based LIME,它使用超像素来创建图像的局部表示,然后使用LIME来解释与这些超像素相关的机器学习模型的预测结果。这种方法的目标是提高解释性,帮助我们更好地理解模型是如何基于图像的局部特征做出预测的。通过关注图像的关键局部区域,我们可以更清晰地了解模型的决策过程。

第二类是Grad-based GradCam,它指的是使用梯度信息来生成GradCam 图,从而可视化深度学习模型对于给定输入图像中哪些区域产生了影响。这有助于我们理解模型是如何基于输入图像的不同部分作出决策的,特别是关于特定类别的决策。这种方法使我们能够直观地看到模型在图像中关注的重要区域,有助于提高模型的解释性。

c633d98b5cd203a024ed3f44c129660b.png


Motivation

对于第一种方法,如果超像素的尺寸过大,可能会导致不准确但更“完整”,更易于人类理解的输出;反之,对于第二种方法,如果超像素的尺寸过小,可能会导致不准确的输出,但更容易理解。这两种方法的解释都不够人性化,所以,作者希望能够实现一种对人类友好的,也能够高精度预测的方法。

Approach

本文中,作者提出了一种通用且灵活的基于概念的解释方法,即Explain Any Concept(EAC),它可以用任何概念解释模型预测。该方法分为三个阶段:第一阶段,Segmented Image,使用模型SAM将输入图像划分为一组视觉概念;第二阶段,训练一个每个输入等效的(PIE)代理模型来近似目标DNN的行为;第三阶段,使用代理模型通过第一阶段获得的概念有效地解释模型预测。

值得注意的是,在EAC的第二阶段,作者使用Shapley值来识别有助于目标模型预测的关键概念。然而,尽管Shapley值很有效,但是由于其指数复杂性,计算成本很高。所以,作者提出了(PIE)的方案来降低目标模型的复杂性,这可以显著降低Shapely值的计算成本。

501f3fb97f143d3158cd9155836b0709.png


Post-hoc Model Explanation: EAC

如下图是所提方法的效果图,它规避了SuperPixel-based LIME和Grad-based GradCam的缺点,可以将最完整、最准确的内容解释出来,对人类也是十分友好的。

d473a3a04a32c1c6019d337638d270ca.png


Comparison

下图中展示了几个案例,证明了EAC在解释模型预测方面的有效性。我们可以观察到,EAC在解释其他测试用例中的模型预测方面显著优于其他方法。EAC生成了更多“格式良好的”概念级别的解释,而这些解释在下图的案例中都是人类可理解的。例如,在第一种情况下,EAC正确地突出了“训练”作为概念级别的解释,而前三个基线方法会产生一些可忽略的像素、图像的片段(第4、第5和第6个基线)或整个图像(第7个基线)。对比图显著说明了EAC在理解性方面的优势。

bf82fac21e6ef86839c33ccf31f22af8.png


Experiments

该部分通过实验验证了EAC方法的有效性。与其他基线方法的对比结果显示,EAC在不同条件下的效果都要优于其他方法。比如,以ImageNet和CoCO作为数据集,在不同的基线方法中插入或删除新的概念,比较对模型性能的影响,EAC都实现了更高的AUC值,显著优于其他方法。

cc5faef74df19a12655bfba7c0f356af.png

Human-friendly Explanation

本篇工作还进行了有意思的人机交互实验。作者通过随机邀请6位该领域的研究者,以此来投票选出认为对人类最为友好的解释方法。实验显示,EAC在所有baseline中得分最好,能够预测最完整的概念,也更易于人类理解。

b5daff75320524775f7f3096527e9a1e.png

Conclusion

本文提出的框架有两大优势。第一,模型的准确度很高,这可以由上述的Insertion和Deletion实验体现;第二,XAI本质上是需要服务人类的,所以它的输出对人类而言应该是友好的,而本文首次在XAI中提出了一种创新性的人机交互实验,并且所提方法更易于人类理解。

Future Work

本文所提出的EAC方法也可用于解释 DNN 对医学图像的预测,但是目前而言,效果并不够好,这可能会误导医生并导致严重的后果。因此,作者期望在将来能够有更多的研究者专注于该细分领域,实现更加鲁棒的新方法。

整理:陈妍
审核:孙奥

提醒

点击“阅读原文”跳转到01:33:22

可以查看回放哦!

往期精彩文章推荐

f4de7fbe699fd2a1ce274f5c7433e2a0.jpeg

记得关注我们呀!每天都有新知识!

 关于AI TIME 

AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。

迄今为止,AI TIME已经邀请了1400多位海内外讲者,举办了逾600场活动,超600万人次观看。

106ed7f95922544dd2dad5950cb1c737.png

我知道你

在看

~

364502696231c7f9f78bbef22cc1a493.gif

点击 阅读原文 观看回放!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/228144.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

服务器安全的威胁和防范

由于服务器发挥着至关重要的作用,因此存储在服务器上的机密数据和信息非常具有价值。做好服务器安全至关重要。 常见的服务器安全隐患包括: 1.恶意的攻击:遭受CC攻击和DDoS攻击,导致游戏或是网站打不开,严重影响业务…

【智能算法】11种混沌映射算法+2种智能算法示范【鲸鱼WOA、灰狼GWO算法】

目录 1 主要内容 2 部分代码 3 程序结果 4 下载链接 1 主要内容 混沌映射算法是我们在智能算法改进中常用到的方法,本程序充分考虑改进算法应用的便捷性,集成了11种混合映射算法,包括Singer、tent、Logistic、Cubic、chebyshev、Piecewise…

华为面试题,连续出了三年!

写在前面 据说,这是一道被华为 2021、2022 和 2023 都出过的题目 🤣 华为是「卷」的发明者,但不是「内卷」发明者,毕竟只有华为是实打实的给加班费。 这么卷的公司,怎么也不更新一下题库。 难道没人做出来就不用考虑换…

2023-12-17 AIGC-AnimateDiff详细安装和使用教程

AnimateDiff专用模型下载 AnimateDiff有其自身专门的运动模型mm_sd_v15_v2.ckpt 和 专属的镜头运动lora,需要放置在对应的位置。 stablediffusion位置: 运动模型放在stable-diffusion-webui\extensions\sd-webui-animatediff\model里面 运动lora放在stable-diffusion-web…

Quartus 18.1软件及支持包安装教程

安装前最好关闭电脑的杀毒软件和防火墙 安装包可以到Quartus官网下载需要的版本,注意选择操作系统 Quartus官网:FPGA 设计软件 - 英特尔 Quartus Prime (intel.cn) 下载解压后以管理员的身份运行 QuartusSetup-18.1.0.625.exe文件,版本不同…

中国剩余定理CRT

文章目录 作用证明AcWing 204. 表达整数的奇怪方式CODE 作用 用于求模数两两互质的线性同余方程组,若不互质则不存在解。 《孙子算经》中有这样一个问题:“今有物不知其数,三三数之剩二,五五数之剩三,七七数之剩二&am…

【漏洞复现】CVE-2023-6848 kodbox远程命令执行

漏洞描述 kodbox 是一个网络文件管理器。它也是一个网页代码编辑器,允许您直接在网页浏览器中开发网站。您可以在基于 Linux、Windows 或 Mac 的平台上在线或本地运行 kodbox。唯一的要求是要有 PHP 5及以上。 kalcaddle kodbox 中发现漏洞,最高版本为 1.48。它已被宣布为关…

【Java】SpringBoot中实现Redis Stream队列

SpringBoot实现Redis Stream队列 前言 简单实现一下在SpringBoot中操作Redis Stream队列的方式,监听队列中的消息进行消费。 jdk:1.8 springboot-version:2.6.3 redis:5.0.1(5版本以上才有Stream队列)…

C++实现简单的猜数字小游戏

猜数字 小游戏介绍:猜数字游戏是令游戏机随机产生一个100以内的正整数,用户输入一个数对其进行猜测,需要你编写程序自动对其与随机产生的被猜数进行比较,并提示大了,还是小了,相等表示猜到了。如果猜到&…

网络(九)三层路由、DHCP以及VRRP协议介绍

目录 一、三层路由 1. 定义 2. 交换原理 3. 操作演示 3.1 图示 3.2 LSW1新建vlan10、20、30,分别对应123接口均为access类型,接口4为trunkl类型,允许所有vlan通过 3.3 LSW2新建vlan10、20、30,配置接口1为trunk类型&…

报数游戏C语言

分析:掌握数字移动的规律,以及判断,我们可以用一个二维数组来记录每一个人说的数字,就像第一张图片一样,西安向右边移动,再向左下移动,再向左边移动,在向右边移动,在可以用一个数组来…

微服务保护--线程隔离(舱壁模式)

一、线程隔离的实现方式 线程隔离有两种方式实现: 线程池隔离 信号量隔离(Sentinel默认采用) 如图: 线程池隔离:给每个服务调用业务分配一个线程池,利用线程池本身实现隔离效果 信号量隔离&#xff1a…

数据分析(一)(附带实例和源码)

一、主要目的: 主要利用Python包,如Numpy、Pandas和Scipy等常用分析工具并结合常用的统计量来进行数据的描述,把数据的特征和内在结构展现出来。熟悉在Python开发环境中支持数据分析的可用模块以及其中的方法,基于一定的样例数据…

前端视角看 Docker : 基础命令全面指南

引言 Docker是一种开源的容器化平台,它允许开发者将应用程序和其依赖打包在一个轻量级的、可移植的容器中。这使得应用程序在不同的环境中部署变得简单且高效。本文将介绍Docker的一些基础命令和概念,帮助初学者快速上手。 1. Docker简介 Docker使用…

pl_vio线特征·part II

pl_vio线特征part II 0.引言4.线段残差对位姿的导数4.1.直线的观测模型和误差4.2.误差雅克比推导4.3.误差雅可比求导简洁版(不含imu坐标系转换)4.4.相关代码 0.引言 pl_vio线特征part I 现在CSDN有字数限制了,被迫拆分为两篇文章。 4.线段残差对位姿的导数 这一小…

ASP.NET MVC权限管理系实战之一验证码功能实现

1,权限的管理系统:开发项目必备的一个的功能;该项目使用 ASP.NET MVC5 SqlServer EF6 IOC容器 BoostStrap 2,登录界面验证码功能实现,整体效果如下; 3,接下来就是代码部分实现,前端…

白盒测试、接口测试、自动化测试

一、什么是白盒测试 白盒测试是一种测试策略,这种策略允许我们检查程序的内部结构,对程序的逻辑结构进行检查,从中获取测试数据。白盒测试的对象基本是源程序,所以它又称为结构测试或逻辑驱动测试,白盒测试方法一般分…

在Windows上通过VS2019自带的Cmake来编译OpenCV-4.5.3源码

文章目录 用VS打开OpenCV源码cmake的配置及生成操作生成及安装 用VS打开OpenCV源码 方式一:文件–》打开–》Cmake 找到源码根目录下CMakeLists.txt文件 导入即可。 方式二:在开始使用这里 选择 打开本地文件夹 找到源码的根目录,导入即可…

[NAND Flash 4.1] Flash(闪存)存储器底层原理 | 闪存存储器重要参数

依公知及经验整理&#xff0c;原创保护&#xff0c;禁止转载。 专栏 《深入理解NAND Flash》 <<<< 返回总目录 <<<< ​全文 5000 字。 从底层物理原理上了解 Nand Flash。 1. 存储器诞生&#xff1a; 现代计算机使用存储器来存储数据&#xff0c;其…

插入排序----希尔排序

希尔排序 希尔排序法又称缩小增量法。希尔排序法的基本思想是&#xff1a;先选定一个整数&#xff0c;把待排序文件中所有记录分成个gap组&#xff0c;所有距离为的记录分在同一组内&#xff0c;并对每一组内的记录进行排序。然后&#xff0c;取&#xff0c;重复上述分组和排序…