正确的原因是错误的:可解释的 ML 技术能否检测出虚假相关性?

Right for the Wrong Reason: Can Interpretable ML Techniques Detect Spurious Correlations?

摘要

虽然深度神经网络模型提供了无与伦比的分类性能,但它们容易在数据中学习虚假相关性。如果测试数据与训练数据来自相同的分布,则使用性能指标很难检测这种对混淆信息的依赖性。可解释的ML方法,如事后解释或固有的可解释分类器,有望识别错误的模型推理。然而,有好坏参半的证据表明,这些技术中的许多是否真的能够做到这一点。

本文提出了一种严格的评估策略来评估解释技术正确识别虚假相关性的能力。使用这种策略,我们评估了五种事后解释技术和一种固有的可解释方法,以证明它们在胸部 X 射线诊断任务中检测三种人为添加的混杂因素的能力。我们发现,事后技术 SHAP 以及固有的可解释 Attri-Net 提供了最佳性能,可用于可靠地识别错误的模型行为。
代码地址

本文方法

在这里插入图片描述
我们在数据集上训练分类器,其中包含三种类型的人为添加的混杂因素,并用箭头突出显示。然后评估了解释技术正确识别对这些混杂因素的依赖的能力(如Attri-Net [24]所示)

评估策略:
假设一个设置,其中基于二元神经网络的分类器的开发数据包含与目标标签的未知虚假相关性。

为了定量研究这种设置,通过在具有正标签的病例百分比中添加混杂效应(例如医院标签)来创建具有人工虚假相关性的训练数据,其中我们改变百分比p ∈ {0, 20, 50, 80, 100}。例如,当 p = 100% 时,训练集中的所有正图像都将具有人工混杂,而当 p = 0% 时,没有杂散信号。随着 p 的增加,对杂散信号的依赖变得更加可能。带有负标签的图像保持不变。

在评估中,我们考虑了一种场景,其中测试数据包含相同的混杂类型,其比例与相应训练中使用的比例 p 相同。在这种情况下,我们无法判断分类器是否依赖于分类性能的混淆特征。因此,我们的目标是研究解释技术是否可以识别分类器出于错误的原因预测正确的事情。我们对广泛使用的CheXpert数据集的胸部X射线图像进行了所有实验,其中我们专注于心脏扩大疾病的二元分类任务。我们将数据集分为训练(80%)、验证(10%)、测试(10%)集。

研究混杂因素:
研究了三种类型的混杂因素,这些混杂因素的灵感来自现实世界的人工制品。首先,我们研究放置在图像左下角的医院标签。其次,我们在光路组件上添加了可能由异物引起的高信号的垂直线(见图1b)。最后,我们考虑图像下部图像的倾斜遮挡,这是我们在 CheXpert 数据集中观察到的许多图像的伪影

测量混杂检测的评估指标

我们提出了两个新颖的指标,它们反映了解释正确识别虚假相关性的能力

混杂敏感性 (CS)
首先,如果分类器基于混杂因素做出决定,则解释应该能够正确地归因于混杂因素。我们通过将每个测试图像的真阳性归因数除以混淆像素总数来评估此属性。如果一个像素是受混杂因素影响的像素的一部分,并且根据视觉解释,它位于前 10% 的归因像素中,则我们认为它是真正的阳性。因此,如果所有混淆像素都在属性的前 10% 中,则获得最大灵敏度 1。请注意,我们不会惩罚混淆标签之外的归因,因为这些归因仍然是正确的。为了保证我们只评估预测实际受混杂因素影响的样本,我们只包括有和没有混杂标签的预测属于相反类别的图像。为了减少计算时间,我们每次评估最多使用 100 个样本。如果数据包含 p = 0% 混淆数据点,则最佳解释方法应获得 0 的 CS 分数,因为在这种情况下,不应归因于杂散信号。为了增加p,混杂灵敏度应该增加,即解释应该反映分类器对混杂因素的依赖性增加

通过解释normalised cross correlation NCC 对预测变化的敏感性:
其次,解释不应随分类器预测的变化而变化。也就是说,如果分类器对特定图像的预测在添加或删除混杂因素时发生变化,则解释也应该不同。当混杂因素存在或不存在时,我们使用测试图像解释之间的平均归一化互相关 (NCC) 来测量这一特性。同样,我们只评估在添加混杂因素时预测发生变化的图像,因为在这些情况下,我们知道分类器依赖于混杂因素,并且我们最多评估 100 个样本。如果训练数据包含 p = 0% 混淆数据点,则最优解释方法应获得较高的 NCC 分数,因为在这种情况下,有和没有混杂因素的解释应该是相似的。为了增加 p,NCC 分数应降低,以反映分类器对混杂因素的依赖性增加

实验结果

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/1586.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

mysql基础20——数据备份

数据备份 数据备份有2种 一种是物理备份 一种是逻辑备份 物理备份 物理备份 通过把数据文件复制出来 达到备份的目的 用得比较少 逻辑备份 逻辑备份 把描述数据库结构和内容的信息保存起来 达到备份的目的 是免费的 数据备份工具 mysqldump (3种模式&#x…

【蓝桥杯2025备赛】集合求和

集合求和 题目描述 给定一个集合 s s s(集合元素数量 ≤ 30 \le 30 ≤30),求出此集合所有子集元素之和。 输入格式 集合中的元素(元素 ≤ 1000 \le 1000 ≤1000) 输出格式 s s s 所有子集元素之和。 样例 #1 …

Java面试八股之marshalling和demarshalling

marshalling和demarshalling Marshalling(序列化)是将内存中的对象状态转化为适合传输或存储的格式(如字节流、JSON、XML),以便进行网络通信、持久化存储或跨平台/语言交互操作。Demarshalling(反序列化&a…

AI大模型探索之路-实战篇3:基于私有模型GLM-企业级知识库开发实战

文章目录 前言概述一、本地知识库核心架构回顾(RAG)1. 知识数据向量化2. 知识数据检索返回 二、大模型选择1. 模型选择标准2. ChatGLM3-6B 三、Embedding模型选择四、改造后的技术选型五、资源准备1. 安装git-lfs2. 下载GLM模型3. 下载Embeding模型 六、…

开源啦!一键部署免费使用!Kubernetes上直接运行大数据平台!

市场上首个K8s上的大数据平台,开源啦! 智领云自主研发的首个 完全基于Kubernetes的容器化大数据平台 Kubernetes Data Platform (简称KDP) 开源啦🚀🚀 开发者只要准备好命令行工具,一键部署 Hadoop,Hi…

如何在Matplotlib中绘制平滑曲线

很多时候,我们有从非常分散的数据列表中生成的线图,这使得图形看起来像连接点的直线,或者非常密集,这导致数据点彼此非常接近,因此图看起来很混乱。 默认情况下,matplotlib.pyplot.plot()函数通过用直线连…

在protobuf里定义描述rpc方法的类型

service UserServiceRpc //在test.proto中定义 { rpc Login(LoginRequest)returns(LoginResponse); rpc GetFriendLists(GetFriendListRequest)returns(GetFriendListResponse); } test.proto文件生成test.pb.cc protoc test.proto --cpp_out./ 将生成的…

IDM的实用功能介绍+下载地址

下载地址 : 下载到idm 互联网下载管理器(IDM)实用功能概述 1. 多线程下载 IDM使用多线程技术,将文件分割成多个部分同时下载,显著提高下载速度。 2. 计划任务 用户可以设定下载任务的开始时间,甚至在特…

Wpf 使用 Prism 实战开发Day21

配置默认首页 当应用程序启动时&#xff0c;默认显示首页 一.实现思路&#xff0c;通过自定义接口来配置应用程序加载完成时&#xff0c;设置默认显示页 步骤1.创建自定义 IConfigureService 接口 namespace MyToDo.Common {/// <summary>/// 配置默认显示页接口/// <…

在一台笔记本电脑上试用Ubuntu22.04

在一台笔记本电脑上试用Ubuntu22.04。 本来想看以下该操作系统能否识别笔记本电脑上的硬盘&#xff0c;于是下载试一下。选了一个国内镜像网站下载。下载速度很快。下载以后用软件win image 将下载的iso文件写到U盘上&#xff0c;用的是usb2.0的U盘&#xff0c;该操作用时11分…

jmeter及PTS压测介绍和使用

一、常用压测工具&#xff1a; loadrunner apache ab&#xff08;单接口压测最方便&#xff09; jmeter 阿里云PTS&#xff08;原生上传jmeter脚本进行压测&#xff09; 二、jmeter可以压测不同的协议和应用 web http https jdbc for database TCP 三、使用场景及优点 1、功能…

【Qt】探索Qt框架:跨平台GUI开发的利器

文章目录 1. Qt框架概述1.1. Qt框架的优点1.2. Qt框架支持的系统1.3. Qt开发环境 2. 搭建 Qt 开发环境2.1. Qt SDK 的下载和安装2.2. 新建项目: 3. Qt 框架内容简介总结 在当今软件开发领域&#xff0c;跨平台性和用户界面的友好性是至关重要的。而Qt框架作为一款跨平台的C图形…

SQLite的知名用户(二十九)

返回&#xff1a;SQLite—系列文章目录 上一篇:SQLite作为应用程序文件格式&#xff08;二十八&#xff09; 下一篇:SQLite FTS5 扩展&#xff08;三十&#xff09; SQLite被数以百万计的应用程序使用 从字面上看&#xff0c;有数十亿次部署。 SQLite 是 当今世界。 下面…

面试高频:HTTPS 通信流程

更多大厂面试内容可见 -> http://11come.cn 面试高频&#xff1a;HTTPS 通信流程 HTTPS 的加密流程 接下来说一下 HTTPS 协议是如何进行通信的&#xff1a; HTTPS 通信使用的 对称加密 非对称加密 两者结合的算法 HTTPS 通信时&#xff0c;会先使用 非对称加密 让通信双…

C# WPF布局

布局&#xff1a; 1、Grid: <Window x:Class"WpfApp2.MainWindow" xmlns"http://schemas.microsoft.com/winfx/2006/xaml/presentation" xmlns:x"http://schemas.microsoft.com/winfx/2006/xaml" xmlns:d"http://schemas.microsoft.com…

spring版本介绍

Spring Framework 是一个广泛使用的 Java 平台&#xff0c;用于构建企业级应用程序。它提供了一个全面的编程和配置模型&#xff0c;支持现代 Java 应用程序的最佳实践&#xff0c;如依赖注入、面向切面编程以及基于注解的编程模型。自从 Spring 1.0 发布以来&#xff0c;已经经…

阿里云获取个人免费ssl证书【总耗时1分钟】【隐藏的操作流程】

1共10张图 按照图片中的指示流程1分钟就获取好了 对比&#xff1a;自己搭建个docker制作获取&#xff0c;需要10分钟以上 ps&#xff1a;看不懂图片我&#xff0c;99RMB&#xff0c;远程搞【专业领域的ssl证书选择】

JDBC学习

DriverManager&#xff08;驱动管理类&#xff09; Drivermanager的作用有&#xff1a; 1.注册驱动&#xff1b; 2.获取数据库连接 Class.forName("com.mysql.cj.jdbc.Driver"); 这一行的作用就是注册Mysql驱动&#xff08;把我们下载的jar包加载到内存里去&…

【QT进阶】Qt http编程之用户登录注册功能实现

往期回顾 【QT进阶】Qt http编程之http与https简单介绍-CSDN博客 【QT进阶】Qt http编程之后端API测试工具postman使用介绍-CSDN博客 【QT进阶】Qt http编程之http相关类的简单介绍-CSDN博客 【QT进阶】Qt http编程之用户登录注册功能实现 一、最终效果展示 重点在逻辑实现&a…

6. DAX 时间函数-- DATE 日期--FIRSTDATE \LASTDATE\DATESMTD\DATESQTD\DATESYTD

函数名目的语法返回值FIRSTDATE 返回指定日期列在当前上下文中的第一个非空日期。FIRSTDATE ( <日期列> )表 包含具有日期值的单列和单行的表。LASTDATE返回指定日期列在当前上下文中的最后一个非空日期。LASTDATE ( <日期列> )表 包含具有日期值的单列和单行的表。…