机器学习可解释性

机器学习的稳健性、可解释性和结果正确性等是人工智能安全可信应用必须解决的关键问题。

传统机器学习:

  • 内置可解释性:决策树IF-Then规则,直观可理解
  • 事后可解释性:训练结束后的可解释技术
  • 特定于模型体系结构的解释
  • 与解释方法及模型无关联的解释

深度学习:

  • 全局解释:机器如何对总体进行特征判断
  • 局部解释:机器说明如何判断这个样例

可解释性深度学习的类型:

  • 语义性解释:网络中间层可视化(降维)、特征重要度(随机掩码)、损失函数的可解释性约束、对抗样本(凹槽流形)。
  • 原理性可解释:过参数化的有效性理论、网络训练的泛化研究(随机矩阵、拓扑)、网络结构的复杂度研究、深度学习的万能逼近。

语义可解释机器学习方法与理论仍然处于探索阶段,聚焦于对重要特征及网络层次结构认识的研究上,随机性带来的可解释性方面挑战需要关注。

原理性解释进展与问题

  • 过参数化模型的良性过拟合--为什么大参数量的深度学习模型没有产生过拟合(目前主要面向简单模型和具有一定特性的随机分布数据)

  • 收敛性和等效模型的研究----深度学习训练过程如何影响泛化性能(目前随机梯度下降的泛化理论适用范围仍然较弱)

  • PAC框架下的复杂度研究--深度模型的结构如何影响泛化性能(挑战:结构复杂度刻画)

  • 激活函数的研究和对比--深度模型的表达能力如何(挑战:模型非线性对表达能力的影响)激活函数在不同任务和数据中作用不同,常见的激活函数的逼近能力研究较为完善,但对网络泛化性能的贡献不理解。

  • 对抗样本存在性和对抗鲁棒型的样本复杂度--深度模型面对对抗数据时是否存在缺陷(对抗数据的存在性证明)随机网络上对抗性样本的存在性不能简单迁移到随机初始化的网络(有训练过程)上,对抗样本存在性和模型深度之间的关系不明确。

统计机器学习的原理是大数定理,面临的挑战是可学习性的可解析性
深度学习的原理是逼近,挑战是泛化性能的可解释性

可学习理论

可学习理论是机器学习可信性的基础:为机器学习框架与模型是否可信提供看可解释性理论

可学习理论与模型评估依据:准确度和损失

经典学习理论:寻求错误率意义下的泛化误差上界,准确度和损失是PAC可学习理论及其拓展理论基础。

经典学习算法:以错误率的连续凸上界构造目标函数,准确度和损失学习模型评估的重要依据

以准确度或其变形为目标的模型评价不能真实反应学习模型的客观学习能力,与实际情况形成一致的随机现象,可看作两个分布的一致观测中部分是随机导致的,分布之间带有随机因素的一致性为随机一致性。如何消除随机一致性对学习理论和模型评估的影响?任务和数据复杂程度都和随即一致性强相关。

影响随即一致性的因素:

学习证据缺乏完备性和充分性、准确性(训练数据采样随机性、标签标注偏差);

学习系统随机性、非理性、不可复现(算法设计随机、模型选择随机)

以上因素道中学习过程失去客观性、合理性和可解释性

随即一致性对机器学习理论的可解释性带来的挑战:
 

  • 影响经典学习理论的理论基础

  • 影响学习模型的泛化能力

  • 影响学习模型的公平性

  • 影响学习模型客观评价

参考:山西大学 钱宇华老师会议报告:机器学习可解释性研究现状与思考_哔哩哔哩_bilibili

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/56225.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

VS Code设置右侧滚动条高亮选中的字符位置

打开菜单“文件 -> 首选项 -> 设置”, 搜索“hightlight”,扩展中的Highlight Selections,再点击“在 settings.json中编辑”, 将editor.selectionHighlight选项改为true保存即可

【读书笔记·VLSI电路设计方法解密】问题12:制造MOSFET晶体管的主要工艺步骤是什么

VLSI芯片是在半导体材料上制造的,这种材料的导电性介于绝缘体和导体之间。通过一种称为掺杂的工艺引入杂质,可以改变半导体的电气特性。能够在半导体材料的细小且定义明确的区域内控制导电性,促使了半导体器件的发展。结合更简单的无源元件(电阻、电容和电感),这些器件被…

股市入门常见术语介绍

鉴于最近行情讨论火热,我也想借此平台,结合我大学时期身边同学老师的投资经历,写一篇交易入门术语简介。内容不多但是足以达到科普之用。 ​ 希望大家能谨慎对待投资,始终保持谦虚学习的态度。不要迷失在瞬息万变的金融市场&…

Redis拒绝连接问题分析与解决方案

目录 前言1. 问题描述2. Redis拒绝连接的常见原因分析2.1 Redis服务未启动2.2 Redis配置中的绑定地址问题2.3 防火墙或安全组问题2.4 Redis连接池耗尽2.5 Redis服务器负载过高2.6 权限配置问题 3. 深度解决方案和优化建议4. 总结 前言 在分布式系统中,Redis作为高性…

游戏服务端架构演进

文章目录 前言初出茅庐粗通皮毛略有小成炉火纯青内劲深厚最后 前言 对于网络游戏,一般分为客户端和服务端,客户端主要负责界面图像的渲染与一些交互操作,服务端主要负责数据的业务处理与存储还有与客户端之间的信息交互 比如玩家聊天、广播…

黑马程序员-redis项目实践笔记1

目录 一、 基于Session实现登录 发送验证码 验证用户输入验证码 校验登录状态 Redis代替Session登录 发送验证码修改 验证用户输入验证码 登录拦截器的优化 二、 商铺查询缓存 缓存更新策略 数据库和缓存不一致解决方案 缓存更新策略的最佳实践方案 实现商铺缓…

TS中如何正确处理window类型

在Typescript项目中,你可能都遇到过这个错误: Window & typeof globalThis 类型上不存在属性 X。 快速修复方案 我们将介绍几种不同的解决方案来解决这个问题。 Window 接口是在名为 lib.dom.d.ts 的文件中全局定义的。你可以使用各种技术来更改它&a…

Windows 11 24H2版本有哪些新功能_Windows 11 24H2十四大新功能介绍

距离上次发布的23H2版本已经过去了一年时间,现在,Win 11的24H2版本终于等到了,微软已经全面公开发布Win11 24H2版本,版本号为26100.1742,此次官宣的版本包括了消费者版、商业版、LTSC 2024版等,各种语言版本…

如何启动hive

检查mysql是否启动 通过Navicat测试mysql是否可以连接 找打hive配置文件所在目录 检查连接mysql的账号密码是否正确,如果不正确就要修改为正确的 初始化hive元数据存储的库:schematool -dbType <database_type> -initSchema 检查mysql中是否创建hive数据库,这里看到hive数…

zookeeper客户端

启动单机版的zookeeper 配置Maven环境 (1) IDEA自带maven (2) 更新Maven库镜像地址&#xff1a; ① 拷贝D:\Program Files\JetBrains\IntelliJ IDEA 2018.3.5\plugins\maven\lib\maven3\conf\settings.xml [IntelliJ的安装目录]到 C:/用户/username/.m2 (如果.m2文件不存在&…

华宇携司法大模型亮相2024中国移动全球合作伙伴大会

2024中国移动全球合作伙伴大会于10月11日在广州琶洲保利世贸博览馆盛大开幕。本届大会以“智焕新生 共创AI时代”为主题&#xff0c;深入探讨数据、算力与人工智能如何深度融合&#xff0c;全力推进AI规模发展、规模应用&#xff0c;加快形成AI技术能力、经济效益上的规模效应&…

第十三章 RabbitMQ之消息幂等性

目录 一、引言 二、消息幂等解决方案 2.1. 方案一 2.2. 方案二 一、引言 幂等是一个数学概念&#xff0c;用函数表达式来描述是这样的&#xff1a;f(x) f(f(x)) 。在程序开发中&#xff0c;则是指同一个业务&#xff0c;执行一次或多次对业务状态的影响是一致的。有些业务…

react实现实时计时的最简方式

js中时间的处理&#xff0c;不借助于moment/dayjs这样的工具库&#xff0c;原生获取格式化的时间&#xff0c;最简单的实现方式可以参考下面这样。 实现效果 代码实现 封装hooks import { useState, useEffect } from "react";export function useCountTime() {c…

Python酷库之旅-第三方库Pandas(150)

目录 一、用法精讲 681、pandas.Timestamp.now方法 681-1、语法 681-2、参数 681-3、功能 681-4、返回值 681-5、说明 681-6、用法 681-6-1、数据准备 681-6-2、代码示例 681-6-3、结果输出 682、pandas.Timestamp.replace方法 682-1、语法 682-2、参数 682-3、…

VUE 开发——Vue学习(三)—— 智慧商城项目

目录 解释各个模块 api接口模块&#xff1a;发送ajax请求的接口模块utils工具模块&#xff1a;自己封装的一些工具方法模块components组件模块&#xff1a;全局通用的组件router路由模块&#xff1a;封装要所有路由views&#xff1a;各个页面assets&#xff1a;各种资源 van…

源码编译llama.cpp for windows on arm

源码编译llama.cpp for windows on arm 这里有编译好的&#xff0c;直接下载使用 https://github.com/turingevo/llama.cpp-build/releases 1 先编译openblas for windows on arm 查看我的文章 《源码编译 openblas for windows on arm》 2 启用OpenBlas加速 上一步openb…

Java+Jenkins实现自动化打包部署流程

目录 jenkins简介 前置依赖 1. jdk17 2.apache maven 3.8.6 3.git 4.docker 5.下载jenkins 启动配置jenkins 优缺点对比 Jenkins 的优点&#xff1a; Jenkins 的缺点&#xff1a; jenkins简介 Jenkins 是一个开源的自动化服务器&#xff0c;可以用于自动化各种任务&…

Mistral AI 开源 Pixtral 12B 多模态 LLM,多场景能力理解,支持中文指令遵循!

Mistral AI 开源了 Pixtral 12B 多模态 LLM。具有自然场景理解&#xff0c;代码生成&#xff0c;图像转代码&#xff0c;图像理解&#xff0c;多图指令跟随&#xff0c;图表理解与分析以及复杂图形推理等多项能力。从效果演示来看模型的能力很强&#xff0c;其中对中文能力的理…

利用C++封装鼠标轨迹算法为DLL:游戏行为检测的利器

在现代软件开发中&#xff0c;鼠标轨迹模拟技术因其在自动化测试、游戏脚本编写等领域的广泛应用而备受青睐。本文将介绍如何使用C语言将鼠标轨迹算法封装为DLL&#xff08;动态链接库&#xff09;&#xff0c;以便在多种编程环境中实现高效调用&#xff0c;同时探讨其在游戏行…

pymobiledevice3使用介绍(安装、常用命令、访问iOS沙盒目录)

项目地址&#xff1a;https://github.com/doronz88/pymobiledevice3 首先先介绍一下pymobiledevice3&#xff0c; pymobiledevice3是用Python3 实现的&#xff0c;用于处理 iDevices&#xff08;iPhone 等&#xff09;。它可以跨平台使用&#xff0c;支持&#xff1a;windows…