Evidential Deep Learning和证据理论教材的区别(主要是概念)

最近终于彻底搞懂了Evidential Deep Learning,之前有很多看不是特别明白的地方,原来是和证据理论教材(是的,不只是国内老师写的,和国外的老师写的教材出入也比较大)的说法有很多不一样,所以特地写了这一篇来做一下笔记。

证据理论做模式识别的话第一件事是构建辨识框架(FoD)及其幂集,第二件事是写基本概率指派,基本概率指派就是一个函数,名为BPA或mass函数。ENN这里构建FoD及其幂集和证据理论的做法是一样的,但是注意ENN所构建的mass函数是由这样的二元组构成的:
< b , u > : ∑ i = 1 K b i + u = 1 <\mathbf{b},u>:\sum_{i=1}^{K}b_i+u=1 <b,u>:i=1Kbi+u=1
其中 b = { b 1 , . . . , b K } \mathbf{b}=\{b_1,...,b_K\} b={b1,...,bK} K K K类目标的belief, u u u是uncertainty。需要注意的是如果按照我们国内证据理论的教材的话,其实 b \mathbf{b} b u u u都是belief,只不过 b \mathbf{b} b是赋予给单子集的belief, u u u是赋予给FoD的belief(然后呢,赋予给FoD的belief的语义是“我只知道待测样本在这些目标之间,但是具体是哪一个我不知道”的belief,这确实是一种uncertainty,但这只是证据理论所建模的uncertainty的一种),从国内证据理论教材的角度来讲,ENN还需要对介于单子集和FoD之间的那一部分假设赋予belief,但是ENN选择了直接赋为0的操作,这种操作是可以的,但是也应该要说明一下的,文章的话是直接把这块省略了。

第二个就是NN的输出是 e i e_i ei,然后有了 e i e_i ei那么上面的 b i = e i / S b_i=e_i/S bi=ei/S S = ( ∑ i = 1 K e i ) + K S=(\sum_{i=1}^{K}e_i)+K S=(i=1Kei)+K就可以算了,文章里面把这个 e i e_i ei叫证据evidence,但是我觉得这么叫其实是有误导作用的。正常来讲,证据理论里面的一条证据evidence,也可以叫一个证据体a body of evidence,其实是说一个基本概率指派函数,也就是一个mass函数,然后全体mass函数的集合构成了全体证据。

另外知乎上还有人问这个图咋来的。配套的文字是在我们的第一组评估中,我们使用相同的LeNet架构在MNIST训练集上训练模型,并在包含字母(而非数字)的notMNIST数据集上进行测试。因此,我们期望得到最大熵(即不确定性)的预测。在图3的左面板中,我们展示了所有使用MNIST数据集训练的模型在可能熵范围[0, log(10)]内的经验累积分布函数(CDF)。图中越接近右下角(即熵值越大)的曲线越理想,这表明所有预测都具有最大熵[24]。显然,我们模型的不确定性估计明显优于基线方法。
在这里插入图片描述
MNIST就是手写数据集,一共有10个类,所以范围是[0,log10]。我们知道证据理论里面只知道证据是没法解读的,必须把证据里面的 < b , u > <\mathbf{b},u> <b,u>转译成概率分布才可以。一般来说,证据理论的话最经典的会用Pignistic Transformation完成这个任务,但是这篇论文呢没用,它直接用 p i = α i / S p_i = \alpha_i/S pi=αi/S α i = e i + 1 \alpha_i=e_i+1 αi=ei+1这么做的。有了 p i p_i pi,不就有了NN预测的概率了嘛,然后就可以算熵了。这篇基本可以肯定用的是Shannon 熵,而不是证据理论里面的那些熵。就是不知道为什么,ENN的结果里不确定性都这么大。像作者所说的“图中越接近右下角(即熵值越大)的曲线越理想”更是让人觉得费解。。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/79461.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

text-decoration: underline;不生效

必须得纪念一下&#xff0c;在给文本加下划线时&#xff0c;发现在win电脑不生效&#xff0c;部分mac也不生效&#xff0c;只有个别的mac生效了&#xff0c;思考了以下几种方面&#xff1a; 1.兼容性问题&#xff1f; 因为是electron项目&#xff0c;不存在浏览器兼容性问题&…

VUE SSR(服务端渲染)

&#x1f916; 作者简介&#xff1a;水煮白菜王&#xff0c;一位前端劝退师 &#x1f47b; &#x1f440; 文章专栏&#xff1a; 前端专栏 &#xff0c;记录一下平时在博客写作中&#xff0c;总结出的一些开发技巧和知识归纳总结✍。 感谢支持&#x1f495;&#x1f495;&#…

ARCGIS国土超级工具集1.5更新说明

ARCGIS国土超级工具集V1.5版本更新说明&#xff1a;因作者近段时间工作比较忙及正在编写ARCGISPro国土超级工具集&#xff08;截图附后&#xff09;的原因&#xff0c;故本次更新为小更新&#xff08;没有增加新功能&#xff0c;只更新了已有的工具&#xff09;。本次更新主要修…

刘鑫炜履新共工新闻社新媒体研究院院长,赋能媒体融合新征程

2025年4月18日&#xff0c;大湾区经济网战略媒体共工新闻社正式对外宣布一项重要人事任命&#xff1a;聘任蚂蚁全媒体总编刘鑫炜为新媒体研究院第一任院长。这一举措&#xff0c;无疑是对刘鑫炜在新媒体领域卓越专业能力与突出行业贡献的又一次高度认可&#xff0c;也预示着共工…

java基础从入门到上手(九):Java - List、Set、Map

一、List集合 List 是一种用于存储有序元素的集合接口&#xff0c;它是 java.util 包中的一部分&#xff0c;并且继承自 Collection 接口。List 接口提供了多种方法&#xff0c;用于按索引操作元素&#xff0c;允许元素重复&#xff0c;并且保持插入顺序。常用的 List 实现类包…

UWP发展历程

通用Windows平台(UWP)发展历程 引言 通用Windows平台(Universal Windows Platform, UWP)是微软为实现"一次编写&#xff0c;处处运行"的愿景而打造的现代应用程序平台。作为微软统一Windows生态系统的核心战略组成部分&#xff0c;UWP代表了从传统Win32应用向现代应…

git忽略已跟踪的文件/指定文件

在项目开发中&#xff0c;有时候我们并不需要git跟踪所有文件&#xff0c;而是需要忽略掉某些指定的文件或文件夹&#xff0c;怎么操作呢&#xff1f;我们分两种情况讨论&#xff1a; 1. 要忽略的文件之前并未被git跟踪 这种情况常用的方法是在项目的根目录下创建和编辑.gitig…

AI 组件库是什么?如何影响UI的开发?

AI组件库是基于人工智能技术构建的、面向用户界面&#xff08;UI&#xff09;开发的预制模块集合。它们结合了传统UI组件&#xff08;如按钮、表单、图表&#xff09;与AI能力&#xff08;如机器学习、自然语言处理、计算机视觉&#xff09;&#xff0c;旨在简化开发流程并增强…

【Win】 cmd 执行curl命令时,输出 ‘命令管道位置 1 的 cmdlet Invoke-WebRequest 请为以下参数提供值: Uri: ’ ?

1.原因&#xff1a; 有一个名为 Invoke-WebRequest 的 CmdLet&#xff0c;其别名为 curl。因此&#xff0c;当您执行此命令时&#xff0c;它会尝试使用 Invoke-WebRequest&#xff0c;而不是使用 curl。 2.解决办法 在cmd中输入如下命令删除这个curl别名&#xff1a; Remov…

UE5 UE循环体里怎么写延迟

注&#xff1a;需要修改UE循环蓝图节点或者自己新建个蓝图宏库把UE循环节点的原来代码粘贴进去修改。 一、For Loop With Delay 二、For Each Loop With Delay 示例使用&#xff1a; 标注参考出处&#xff1a;分享UE5自制Loop with delay宏&#xff0c;在loop循环中添加执行…

IP检测工具“ipjiance”

目录 IP质量检测 应用场景 对网络安全的贡献 对网络管理的帮助 对用户决策的辅助作用 IP质量检测 检测IP的网络提供商&#xff1a;通过ASN&#xff08;自治系统编号&#xff09;识别IP地址所属的网络运营商&#xff0c;例如电信、移动、联通等。 识别网络类型&#xff1…

[工具]Java xml 转 Json

[工具]Java xml 转 Json 依赖 <!-- https://mvnrepository.com/artifact/cn.hutool/hutool-all --> <dependency><groupId>cn.hutool</groupId><artifactId>hutool-all</artifactId><version>5.8.37</version> </dependen…

vue3 传参 传入变量名

背景&#xff1a; 需求是&#xff1a;在vue框架中&#xff0c;接口传参我们需要穿“变量名”&#xff0c;而不是字符串 通俗点说法是&#xff1a;在网络接口请求的时候&#xff0c;要传属性名 效果展示&#xff1a; vue2核心代码&#xff1a; this[_keyParam] vue3核心代码&…

spring响应式编程系列:总体流程

目录 示例 程序流程 just subscribe new LambdaMonoSubscriber ​​​​​​​MonoJust.subscribe ​​​​​​​new Operators.ScalarSubscription ​​​​​​​onSubscribe ​​​​​​​request ​​​​​​​onNext 时序图 类图 数据发布者 MonoJust …

基于slimBOXtv 9.16 V2-晶晨S905L3A/ S905L3AB-Mod ATV-Android9.0-线刷通刷固件包

基于slimBOXtv 9.16 V2-晶晨S905L3A&#xff0f; S905L3AB-Mod ATV-Android9.0-线刷通刷固件包&#xff0c;基于SlimBOXtv 9 修改而来&#xff0c;贴近于原生ATV&#xff0c;仅支持晶晨S905L3A&#xff0f; S905L3AB芯片刷机。 适用型号&#xff1a;M401A、CM311-1a、CM311-1s…

使用droidrun库实现AI控制安卓手机

使用droidrun库实现AI控制安卓手机 介绍 DroidRun 是一个框架&#xff0c;通过LLM代理控制 Android 设备。它允许您使用自然语言命令自动化 Android 设备交互。 安装环境 安装源码依赖 git clone https://github.com/droidrun/droidrun.git cd droidrun conda create --nam…

知识库建设全流程指南(AI时代优化版)

知识库建设全流程指南&#xff08;AI时代优化版&#xff09; ​​一、知识库建设的战略定位​​ ​​核心价值锚点​​ ​​AI时代基建​​&#xff1a;知识库是GEO优化的核心载体&#xff0c;决定内容被AI引用的概率权重​​动态护城河​​&#xff1a;结构化知识体系可抵御算…

2025年03月中国电子学会青少年软件编程(Python)等级考试试卷(五级)真题

青少年软件编程&#xff08;Python&#xff09;等级考试试卷&#xff08;五级&#xff09; 分数&#xff1a;100 题数&#xff1a;38 答案解析&#xff1a;https://blog.csdn.net/qq_33897084/article/details/147341437 一、单选题(共25题&#xff0c;共50分) 1. 以下哪个选…

基于RRT的优化器:一种基于快速探索随机树算法的新型元启发式算法

受机器人路径规划中常用的快速探索随机树&#xff08;RRT&#xff09;算法的搜索机制的启发&#xff0c;我们提出了一种新颖的元启发式算法&#xff0c;称为基于RRT的优化器&#xff08;RRTO&#xff09;。这是首次将RRT算法的概念与元启发式算法相结合。RRTO的关键创新是其三种…

进阶篇|CAN FD 与性能优化

引言 1. CAN vs. CAN FD 对比 2. CAN FD 帧结构详解