伪装目标检测的算术不确定性建模

Modeling Aleatoric Uncertainty for Camouflaged Object Detection

  • 伪装目标检测的算术不确定性建模
    • 背景
    • 贡献
    • 实验
    • 方法
      • Camouflaged Object Detection Network(伪装目标检测框架)
      • Online Confidence Estimation Network(在线置信度估计网络)
      • Dynamic Uncertainty Supervision(动态不确定性监督)
      • Uncertainty-Aware Learning(具有不确定性的学习)
    • 损失函数
    • Thinking

伪装目标检测的算术不确定性建模

2022 IEEE/CVF Winter Conference on Applications of Computer Vision (WACV)
code:https://github.com/Carlisle-Liu/OCENet

背景

伪装对象检测,目标存在伪装性的分割

任意的不确定性捕获了观测中的噪声。对于伪装对象检测,由于伪装的前景和背景的外观相似,很难获得高精度的注释,尤其是对象边界周围的注释。我们认为,直接使用“嘈杂”的伪装图进行训练可能会导致模型的泛化能力较差。在本文中,我们引入了一种显式任意不确定性估计技术来表示由噪声标记引起的预测不确定性。具体而言,我们提出了一种置信度感知伪装目标检测(COD)框架,该框架使用动态监督来生成准确的伪装图和可靠的“任意不确定性”。与现有的根据点估计管道产生确定性预测的技术不同,我们的框架将任意不确定性形式化为模型输出和输入图像上的概率分布。我们声称,一旦经过训练,我们的置信度估计网络就可以在不依赖地面实况伪装图的情况下评估预测的像素精度。大量结果表明,该模型在解释伪装预测方面具有优越的性能。
在这里插入图片描述

贡献

  • 1)提出了一种创新的在线置信度估计网络(OCENet)来对伪装物体检测的任意不确定性进行建模。它输出像素级的不确定性,揭示真阴性和假阳性预测,以防止网络变得过于自信
  • 2) 我们的OCENet提供了对预测的初步评估,而不依赖于地面实况;
  • 3) 我们进一步提出了一种困难感知学习伪装目标检测框架,以有效地利用任意不确定性进行硬负挖掘。实验结果表明,我们的模型在解释模型预测方面具有优越的性能。
    提出了一种创新的在线置信度估计网络(OCNet)来对伪装目标检测中的任意不确定性进行建模。我们动态地导出预测和地面实况之间的差异,作为OCENet中不确定性估计模块的监督。通过这种设置,我们的OCENet能够将错误分类的区域识别为不确定区域,并将低不确定性值分配给正确预测的区域。估计的置信度图能够将高不确定性分配给欠分割过分割伪前景预测远离目标对象的幻影分割,以及容易发生错误的对象边界。

实验

数据集:使用COD10K训练集[13]训练我们的模型,并在四个伪装物体检测测试集上进行测试,包括CAMO[28]、CHAELEON[45]、COD10K测试数据集[13]和NC4K数据集[33]。
在这里插入图片描述
在这里插入图片描述
只以初始预测作为输出来训练伪装对象检测网络,并将其表示为“M1”
将整体注意力模块添加到“M1”中,得到“M2”
置信度估计网络的监督:与[ 20、39 ]类似,置信度估计模块生成监督的另一个选项是对预测赋值为0,对跟随对抗学习管道的真值图赋值为1。我们执行了这个实验2,并在表2中显示其结果为’ M3 '。
在这里插入图片描述

方法

  • 引入了一个相互监督的伪装目标检测学习框架来直接对任意不确定性进行建模。我们的框架中包括两个主要模块,即用于生成伪装图的伪装目标检测网络(CODNet)和用于显式估计当前预测中的任意不确定性的在线置信度估计网络(OCNet)
  • 动态置信度监督是根据COD网络和地面实况伪装图的预测结果得出的。置信度估计网络的输出用于引导COD网络通过不确定性引导的结构损失来专注于学习具有低置信度的图像部分。
    在这里插入图片描述

Camouflaged Object Detection Network(伪装目标检测框架)

  • 提出了一种融合模块(FM)来组合不同级别的特征图。逐渐将高级特征与低级特征融合。在每个融合操作中,都包括最高级别的特征以提供语义指导。RCAB来自*[mage super-resolution using very deep residual channel attention networks. In Eur. Conf. Comput. Vis., pages 286–301, 2018.]*
  • 相对低级的特征图F2提供更多的空间信息,这对于分割任务恢复更清晰的结构是重要的。

在这里插入图片描述
在这里插入图片描述

Online Confidence Estimation Network(在线置信度估计网络)

CODNet将模型预测(Dir yini和Dir yref)和图像x的级联作为输入,以产生单通道置信度图,以及最终预测的cref,通过从伪装目标检测网络fθ(x)和地面实况伪装图y的预测导出的动态不确定性监督来监督估计的置信图。
在这里插入图片描述

Dynamic Uncertainty Supervision(动态不确定性监督)

使用预测和基本事实之间的差异作为明确的监督来对任意不确定性进行建模。在我们的工作中,它代表了以输入图像为条件的预测的不确定性。
在这里插入图片描述
在这里插入图片描述

Uncertainty-Aware Learning(具有不确定性的学习)

伪装物体检测在整个图像中具有不同的学习困难。沿着物体边界的像素比远离伪装物体的背景像素更难区分。此外,伪装前景包含具有不同伪装水平的部分,其中一些部分易于识别,例如眼睛、嘴巴等,而另一些部分难以区分,例如身体区域具有与背景相似的外观。我们打算通过在我们的CODNet中建模不确定性意识,在整个图像中建模这种不同的学习难度。具体而言,受[47]的启发,我们提出训练具有不确定性感知结构损失的伪装对象检测网络:
在这里插入图片描述

损失函数

Thinking

还没写完,先就这

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/240737.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

复习linux——时间同步服务

加密和安全当前都离不开时间的同步,否则各种网络服务可能不能正常运行 时间错误可能导致证书应用出错 时间同步服务 多主机协作工作时,各个主机的时间同步很重要,时间不一致会造成很多重要应用故障,利用NTP协议使网络中的各个计算机时间达到…

Stable Diffusion 基本原理

1 Diffusion Model的运作过程 输入一张和我们所需结果图尺寸一致的噪声图像,通过Denoise模块逐步减少noise,最终生成我们需要的效果图。 图中Denoise模块虽然是同一个,但是它会根据不同step的输入图像和代表noise严重程度的参数选择denoise的…

01背包详解,状态设计,滚动数组优化,通用问题求解

文章目录 0/1背包前言一、0/1背包的状态设计1、状态设计2、状态转移方程3、初始状态4、代码实现5、滚动数组优化二维优化为两个一维二维优化为一个一维,倒序递推 二、0/1背包的通用问题求最大值求最小值求方案数 0/1背包 前言 0/1包问题,作为动态规划问…

servlet +thymeleaf渲染引擎

servlet thymeleaf渲染引擎 一、maven坐标 <dependency><groupId>org.thymeleaf</groupId><artifactId>thymeleaf</artifactId><version>3.0.12.RELEASE</version> <!-- 使用适当的Thymeleaf版本 --> </dependency> &…

java 多线程面试

1并行和并发有什么区别&#xff1f; 并行是指多个任务同时执行&#xff0c;需要多核处理器支持&#xff0c;可以显著提高程序的运行速度&#xff1b; 并发是指多个任务交替执行&#xff0c;通过时间片轮转实现&#xff0c;即使在单核处理器上也能实现多任务同时执行的效果。 …

Python通过telnet批量管理配置华为交换机

名称&#xff1a;Python通过telnet批量管理配置华为交换机 测试工具&#xff1a;ensp, Visual Studio Code &#xff0c; Python3.8环境 时间&#xff1a;2023.12.23 个人备注&#xff1a;在NB 项目中&#xff0c;可以批量登录修改交换机配置&#xff0c;以此满足甲方爸爸的…

Pytorch项目,肺癌检测项目之三

成功获取到数据之后&#xff0c;我们需要将数据放到Pytorch里面去处理&#xff0c;我们需要将其转换成Dataset数据集&#xff0c;方便去使用相同的API。要转换成Dataset数据集需要实现两个方法&#xff0c;方法一&#xff1a; 方法二&#xff1a; 运行比较慢的话&#xff0c…

【Linux基础开发工具】gcc/g++使用make/Makefile

目录 前言 gcc/g的使用 1. 语言的发展 1.1 语言和编译器自举的过程 1.2 程序翻译的过程&#xff1a; 2. 动静态库的理解 Linux项目自动化构建工具-make/makefile 1. 快速上手使用 2. makefile/make执行顺序的理解 前言 了解完vim编辑器的使用&#xff0c;接下来就可以尝…

servlet+thymeleaf改良版

servletthymeleaf改良版 一、maven坐标 <dependency><groupId>org.thymeleaf</groupId><artifactId>thymeleaf</artifactId><version>3.0.12.RELEASE</version> <!-- 使用适当的Thymeleaf版本 --></dependency><dep…

网游逆向分析与插件开发-游戏反调试功能的实现-项目需求与需求拆解

上一个专栏结束位置&#xff1a;网游逆向分析与插件开发-代码保护壳的优化-修改随机基址为固定基址-CSDN博客 上一个专栏是做了一个壳有了一定的保护&#xff0c;但是保护还是不够&#xff0c;最大的保护是根上把问题解决了&#xff0c;就是我不允许你对我进行调试&#xff0c…

drawio绘制组织架构图和树形图

drawio绘制组织架构图和树形图 drawio是一款强大的图表绘制软件&#xff0c;支持在线云端版本以及windows, macOS, linux安装版。 如果想在线直接使用&#xff0c;则直接输入网址draw.io或者使用drawon(桌案), drawon.cn内部完整的集成了drawio的所有功能&#xff0c;并实现了云…

【一起学Rust | 框架篇 | Tauri2.0框架】Tauri2.0环境搭建与项目创建

文章目录 前言一、搭建 Tauri 2.0 开发环境二、创建 Tauri 2.0 项目1.创建项目2.安装依赖4. 编译运行 三、设置开发环境四、项目结构 前言 Tauri在Rust圈内成名已久&#xff0c;凭借Rust的可靠性&#xff0c;使用系统原生的Webview构建更小的App 以及开发人员可以灵活的使用各…

IDEA 中 Tomcat 日志乱码

1、服务器输出乱码 修改 File -> settings -> Editor -> General ->Console 中&#xff0c;utf-8改为GBK&#xff0c;反之改成utf-8 2、Tomcat Localhost Log 或者 Tomcat Catalina Log乱码 进入Tomcat 中的conf文件中的logging.properties 哪个有问题改哪个&…

虚拟机的下载、安装(模拟出服务器)

下载 vmware workstation&#xff08;收费的虚拟机&#xff09; 下载vbox 网址&#xff1a;Oracle VM VirtualBox&#xff08;免费的虚拟机&#xff09; 以下选择一个下载即可&#xff0c;建议下载vbox&#xff0c;因为是免费的。安装的时候默认下一步即可&#xff08;路径最好…

【数据安全】Java AES加密和解密

自我介绍 做一个简单介绍&#xff0c;酒架年近48 &#xff0c;有20多年IT工作经历&#xff0c;目前在一家500强做企业架构&#xff0e;因为工作需要&#xff0c;另外也因为兴趣涉猎比较广&#xff0c;为了自己学习建立了三个博客&#xff0c;分别是【全球IT瞭望】&#xff0c;【…

Kubernetes 架构原则和对象设计

什么是 Kubernetes Kubernetes 是谷歌开源的容器集群管理系统 • 基于容器的应用部署、维护和滚动升级&#xff1b; • 负载均衡和服务发现&#xff1b; • 跨机器和跨地区的集群调度&#xff1b; • 自动伸缩&#xff1b; • 无状态服务和有状态服务&#xff1b; • 插件机制…

fba海派和传统海运的区别,亚马逊 FBA货物包装技巧—站斧浏览器

fba海派和传统海运的区别 1、美国FBA海派是什么&#xff1f; 美国FBA海派即将商品通过海洋运输的方式运送到美国亚马逊FBA仓库的服务。这种方式主要适用于大批量或大件商品&#xff0c;因为相比其他物流方式&#xff0c;海派具备成本低和运载量大的优势。 2、传统海运是什么…

编译opencv和opencv_contrib

1 下载源码 下载opencv源码https://github.com/opencv/opencv 下载opencv源码https://github.com/opencv/opencv_contrib 2 开始编译 构建需要下载ffmpeg的包&#xff0c;cmake构建时会自动下载&#xff0c;但是比较满&#xff0c;这里可以从下面链接直接下载 https://downloa…

ECMAScript基础入门:从语法到应用

在此之前我以及发布过关于JavaScript基础知识点大家也可以参考 大家有关于JavaScript知识点不知道可以去 &#x1f389;博客主页&#xff1a;阿猫的故乡 &#x1f389;系列专栏&#xff1a;JavaScript专题栏 &#x1f389;ajax专栏&#xff1a;ajax知识点 &#x1f389;欢迎关注…

C++ Qt开发:Charts折线图绘制详解

Qt 是一个跨平台C图形界面开发库&#xff0c;利用Qt可以快速开发跨平台窗体应用程序&#xff0c;在Qt中我们可以通过拖拽的方式将不同组件放到指定的位置&#xff0c;实现图形化开发极大的方便了开发效率&#xff0c;本章将重点介绍QCharts折线图的常用方法及灵活运用。 折线图…