深度学习鲁棒性、公平性和泛化性的联系

深度学习鲁棒性、公平性和泛化性的联系

  • 前言
  • 1 鲁棒性、公平性、泛化性本质
  • 2 对抗攻击是混杂效应
  • 3 因果推理角度
    • 3.1 稳定学习 VS 公平性
    • 3.2 后门攻击

前言

  读研好不容易从边缘智能,费好大劲被允许转到联邦学习赛道,再费了好大劲和机缘巧合被允许转到可信AI赛道做公平性(一开始的时候觉得对抗样本老有意思了,但是一直不被允许做呜呜呜)。之前的一些存货陆陆续续整理出来,有的还挺有意思的,仅代表一些思考,不一定对。

1 鲁棒性、公平性、泛化性本质

这三者的本质,都是(解决)数据分布的distribution shift的问题,图片节选自李博老师的视频讲座:

2 对抗攻击是混杂效应

假设对抗攻击是混杂效应,参考自 (Adversarial Visual Robustness by Causal Intervention, arXiv 2021),以及张含望老师讲座视频:

  • AI会利用人看不见的pattern进行分类,这些pattern组成混杂因子(confounder)
  • 如果训练数据和测试数据分布一样,这种混杂对于分类实际上是有利的(例如横条纹的“1”很多,横条纹是一个很有用的feature)
  • 如果这种模式被攻击者利用,比如把数字1的背景换成竖着的,实现对抗攻击,让“1”被误分类为“2”这种混杂就是有害的
  • DNN基于输入和输出的统计联系进行学习,不可避免地学习到了混杂这种虚假的关联
  • 但是人是依据因果关联𝑋→𝑌来分类的,希望AI也专注于这种关联
    在这里插入图片描述
    这几者可以统一起来,感觉很有道理:
  • (a)对抗攻击:通过最大化混杂效应 𝑋 ← 𝐶 → 𝑌 𝑋\leftarrow𝐶 \rightarrow𝑌 XCY来覆盖 𝑋 → 𝑌 𝑋 \rightarrow𝑌 XY,让预测出错
  • (b)对抗训练:使用对抗样本训练,最大化在攻击 X = x + δ X=x+\delta X=x+δ下的准确率。因为攻击时使用的与训练时使用的样本相似,对抗训练防止混杂𝛿改变预测结果,阻断了 𝐶 ↛ 𝑌 𝐶 \nrightarrow 𝑌 CY
  • (c) 数据增强:例如用不同样本线性组合训练来增强鲁棒性,让微小的扰动 δ \delta δ只会产生较小的混杂效应,削弱 𝐶 → 𝑌 𝐶\rightarrow𝑌 CY的连接
  • (d)生成模型:使用生成式模型,例如预测时寻找哪一个类别 𝑦 𝑖 𝑦_𝑖 yi最有可能产生能代表输入 𝑥 𝑥 x的样本,生成的过程削弱了混杂因子在原图中的影响 𝐶 ↛ 𝑋 𝐶\nrightarrow 𝑋 CX
  • (e) 去噪:去除噪声对原图( 𝐶 ↛ 𝑋 𝐶 \nrightarrow 𝑋 CX)或者预测结果的影响( 𝐶 ↛ 𝑌 𝐶 \nrightarrow 𝑌 CY
  • (f)随机平滑:加入足够大的高斯噪声,覆盖自然的和攻击的混杂影响𝑐+𝛿

在这里插入图片描述

3 因果推理角度

3.1 稳定学习 VS 公平性

相同点在于——都是希望缓解混杂因子C对预测结果的影响
在这里插入图片描述

3.2 后门攻击

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/59952.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Vue】简易博客项目跟做

项目框架搭建 1.使用vue create快速搭建vue项目 2.使用VC Code打开新生成的项目 端口号简单配置 修改vue.config.js文件,内容修改如下 所需库安装 npm install vue-resource --save --no-fund npm install vue-router3 --save --no-fund npm install axios --save …

python爬虫指南——初学者避坑篇

目录 Python爬虫初学者学习指南一、学习方向二、Python爬虫知识点总结三、具体知识点详解和实现步骤1. HTTP请求和HTML解析2. 正则表达式提取数据3. 动态内容爬取4. 数据存储5. 反爬虫应对措施 四、完整案例:爬取京东商品信息1. 导入库和设置基本信息2. 获取网页内容…

一文学习Android中的Treeview

在Android开发中,TreeView是一种用于显示层次结构的组件,可以让用户展开和折叠子项,以方便查看数据的不同层次。TreeView在文件系统、组织架构、目录结构等场景中非常有用,尽管Android并未提供内置的TreeView控件,但可…

如何快速搭建一个spring boot项目

一、准备工作 1.1 安装JDK:确保计算机上已安装Java Development Kit (JDK) 8或更高版本、并配置了环境变量 1.2 安装Maven:下载并安装Maven构建工具,这是Spring Boot官方推荐的构建工具。 1.3 安装代码编辑器:这里推荐使用Inte…

SLM401A系列42V商业照明线性恒流芯片 线性照明调光在LED模组及灯带智能球泡灯上应用

SLM401A系列型号选型: SLM401A10ED-7G:QFN1010-4 SLM401A15aa-7G:SOT23-3 SLM401A20aa-7G:SOT23-3 SLM401A20ED-7G:QFN1010-4 SLM401A25aa-7G:SOT23-3 SLM401A30aa-7G:SOT23-3 SLM401A40aa-7G:SOT23-3 SLM401A50aa-7G:SOT23-3 SLM401A6…

HTB:GreenHorn[WriteUP]

目录 连接至HTB服务器并启动靶机 使用nmap对靶机TCP端口进行开放扫描 再次使用nmap对这三个端口进行脚本、服务扫描 尝试先通过curl访问靶机80端口 将靶机IP与该域名写入hosts使DNS本地解析 使用浏览器访问greenhorn.htb 使用Wappalyzer插件查看该页面技术栈 尝试在sea…

HarmonyOS-消息推送

一. 服务简述 Push Kit(推送服务)是华为提供的消息推送平台,建立了从云端到终端的消息推送通道。所有HarmonyOS 应用可通过集成 Push Kit,实现向应用实时推送消息,使消息易见,构筑良好的用户关系&#xff0…

精选 Top10 开源调度工具,解锁高效工作负裁自动化

在大数据和现代 IT 环境中,任务调度与工作负载自动化(WLA)工具是优化资源利用、提升生产效率的核心驱动力。随着企业对数据分析、实时处理和多地域任务调度需求的增加,这些工具成为关键技术。 本文将介绍当前技术发展背景下的Top …

【论文阅读】Learning dynamic alignment via meta-filter for few-shot learning

通过元滤波器学习动态对齐以实现小样本学习 引用:Xu C, Fu Y, Liu C, et al. Learning dynamic alignment via meta-filter for few-shot learning[C]//Proceedings of the IEEE/CVF conference on computer vision and pattern recognition. 2021: 5182-5191. 论文…

软件崩溃?提示“由于找不到d3dx9_43.dll”是什么情况?如何有效解决d3dx9_43.dll丢失的方法分享

d3dx9_43.dll错误是电脑经常出现的情况?那么出现“由于找不到d3dx9_43.dll”错误的问题是什么原因导致的呢?同时又有什么办法可以将错误提示“由于找不到d3dx9_43.dll”的问题进行解决呢? d3dx9_43.dll文件缺失是什么情况? d3dx9…

Latex中给公式加边框

1、这里使用的不是 amsmath 的 \boxed 命令, 而是 empheq 的 empheq 环境以及 xcolor 的 \fcolorbox 命令, 下面是代码, 可以分别阅读这两个手册来获取更多的信息 \documentclass{article} \usepackage{xcolor} \usepackage{empheq} \usepackage{amsmath} \begin{document}\be…

设计模式之原型模式(上机考试多套试,每人题目和答案乱序排列场景)

前言: 平常你也付出了很多的时间,但就是没有得到多少收益。就像有时候很多小伙伴问我,我是该怎么学一个我没接触过的内容。我的个人经验非常建议,先不要学太多理论性的内容,而是尝试实际操作下,把要学的内容…

如何提高谷歌收录速度?

相信很多做外贸推广的朋友都遇到过这种情况:网站上线了,但新页面迟迟不被谷歌收录。即使你的内容很优秀,设计也很精美,如果谷歌爬虫抓不到页面,一切努力就白费了。这时候,GSI谷歌快速收录服务就成了“救命稻…

C++builder中的人工智能(15):C++高斯误差线性单元(GELU)

在这篇文章中,我们将探索高斯误差线性单元(GELU:Gaussian Error Linear Unit)是什么,它是如何在人工神经网络(ANN)中工作的,以及GELU可以应用于哪些AI技术。通过学习C中的高斯误差线…

Python | Leetcode Python题解之第552题学生出勤记录II

题目: 题解: class Solution:def checkRecord(self, n: int) -> int:MOD 10**9 7mat [[1, 1, 0, 1, 0, 0],[1, 0, 1, 1, 0, 0],[1, 0, 0, 1, 0, 0],[0, 0, 0, 1, 1, 0],[0, 0, 0, 1, 0, 1],[0, 0, 0, 1, 0, 0],]def multiply(a: List[List[int]],…

网页版五子棋——匹配模块(客户端开发)

前一篇文章:网页版五子棋——用户模块(客户端开发)-CSDN博客 目录 前言 一、前后端交互接口设计 二、游戏大厅页面 1.页面代码编写 2.前后端交互代码编写 3.测试获取用户信息功能 结尾 前言 前面文章介绍完了五子棋项目用户模块的代码…

【微服务】不同微服务之间用户信息的获取和传递方案

如何才能在每个微服务中都拿到用户信息?如何在微服务之间传递用户信息? 文章目录 概述利用微服务网关做登录校验网关转微服务获取用户信息openFeign传递微服务之间的用户信息 概述 要在每个微服务中获取用户信息,可以采用以下几种方法&#…

OpenEuler 下 Docker 安装、配置与测试实例

文章目录 前言1. 环境准备2. 下载 Docker3.配置服务文件4.配置加速器加速下载docker镜像5. 验证 Docker 安装 前言 Docker 安装大致分为包管理器安装、脚本安装、离线手动安装、容器编排工具安装、桌面版安装等,每种安装各有特点,但涉及知识面不少&…

GK7205V500 GK7250V510 国科微 SOC芯片

GK7205V500 芯片是国科推出的新一代高集成度、高画质、低码率、低功耗的 AI IP Camera SoC 芯 片。 芯片集成 ARM Cortex A7 处理器,支持专业的 ISP 图像处理单元,H.265/H.264 视频编码与神经网络 处理单元(NPU)&#xff0c…

_浅谈单片机的gcc优化级别__以双音频信号发生器为例

一、简介 gcc有多种优化级别,一般不选择的情况下,IDE默认是按照-Og或这-O2优化的。 以gcc编译器为例,浅谈一下优化级别,我们常见的优化一般是指gcc的-O2、-Og。除此之外,gcc还有-Os等一系列优化,链接器也有…