伪装目标检测的算术不确定性建模

Modeling Aleatoric Uncertainty for Camouflaged Object Detection

  • 伪装目标检测的算术不确定性建模
    • 背景
    • 贡献
    • 实验
    • 方法
      • Camouflaged Object Detection Network(伪装目标检测框架)
      • Online Confidence Estimation Network(在线置信度估计网络)
      • Dynamic Uncertainty Supervision(动态不确定性监督)
      • Uncertainty-Aware Learning(具有不确定性的学习)
    • 损失函数
    • Thinking

伪装目标检测的算术不确定性建模

2022 IEEE/CVF Winter Conference on Applications of Computer Vision (WACV)
code:https://github.com/Carlisle-Liu/OCENet

背景

伪装对象检测,目标存在伪装性的分割

任意的不确定性捕获了观测中的噪声。对于伪装对象检测,由于伪装的前景和背景的外观相似,很难获得高精度的注释,尤其是对象边界周围的注释。我们认为,直接使用“嘈杂”的伪装图进行训练可能会导致模型的泛化能力较差。在本文中,我们引入了一种显式任意不确定性估计技术来表示由噪声标记引起的预测不确定性。具体而言,我们提出了一种置信度感知伪装目标检测(COD)框架,该框架使用动态监督来生成准确的伪装图和可靠的“任意不确定性”。与现有的根据点估计管道产生确定性预测的技术不同,我们的框架将任意不确定性形式化为模型输出和输入图像上的概率分布。我们声称,一旦经过训练,我们的置信度估计网络就可以在不依赖地面实况伪装图的情况下评估预测的像素精度。大量结果表明,该模型在解释伪装预测方面具有优越的性能。
在这里插入图片描述

贡献

  • 1)提出了一种创新的在线置信度估计网络(OCENet)来对伪装物体检测的任意不确定性进行建模。它输出像素级的不确定性,揭示真阴性和假阳性预测,以防止网络变得过于自信
  • 2) 我们的OCENet提供了对预测的初步评估,而不依赖于地面实况;
  • 3) 我们进一步提出了一种困难感知学习伪装目标检测框架,以有效地利用任意不确定性进行硬负挖掘。实验结果表明,我们的模型在解释模型预测方面具有优越的性能。
    提出了一种创新的在线置信度估计网络(OCNet)来对伪装目标检测中的任意不确定性进行建模。我们动态地导出预测和地面实况之间的差异,作为OCENet中不确定性估计模块的监督。通过这种设置,我们的OCENet能够将错误分类的区域识别为不确定区域,并将低不确定性值分配给正确预测的区域。估计的置信度图能够将高不确定性分配给欠分割过分割伪前景预测远离目标对象的幻影分割,以及容易发生错误的对象边界。

实验

数据集:使用COD10K训练集[13]训练我们的模型,并在四个伪装物体检测测试集上进行测试,包括CAMO[28]、CHAELEON[45]、COD10K测试数据集[13]和NC4K数据集[33]。
在这里插入图片描述
在这里插入图片描述
只以初始预测作为输出来训练伪装对象检测网络,并将其表示为“M1”
将整体注意力模块添加到“M1”中,得到“M2”
置信度估计网络的监督:与[ 20、39 ]类似,置信度估计模块生成监督的另一个选项是对预测赋值为0,对跟随对抗学习管道的真值图赋值为1。我们执行了这个实验2,并在表2中显示其结果为’ M3 '。
在这里插入图片描述

方法

  • 引入了一个相互监督的伪装目标检测学习框架来直接对任意不确定性进行建模。我们的框架中包括两个主要模块,即用于生成伪装图的伪装目标检测网络(CODNet)和用于显式估计当前预测中的任意不确定性的在线置信度估计网络(OCNet)
  • 动态置信度监督是根据COD网络和地面实况伪装图的预测结果得出的。置信度估计网络的输出用于引导COD网络通过不确定性引导的结构损失来专注于学习具有低置信度的图像部分。
    在这里插入图片描述

Camouflaged Object Detection Network(伪装目标检测框架)

  • 提出了一种融合模块(FM)来组合不同级别的特征图。逐渐将高级特征与低级特征融合。在每个融合操作中,都包括最高级别的特征以提供语义指导。RCAB来自*[mage super-resolution using very deep residual channel attention networks. In Eur. Conf. Comput. Vis., pages 286–301, 2018.]*
  • 相对低级的特征图F2提供更多的空间信息,这对于分割任务恢复更清晰的结构是重要的。

在这里插入图片描述
在这里插入图片描述

Online Confidence Estimation Network(在线置信度估计网络)

CODNet将模型预测(Dir yini和Dir yref)和图像x的级联作为输入,以产生单通道置信度图,以及最终预测的cref,通过从伪装目标检测网络fθ(x)和地面实况伪装图y的预测导出的动态不确定性监督来监督估计的置信图。
在这里插入图片描述

Dynamic Uncertainty Supervision(动态不确定性监督)

使用预测和基本事实之间的差异作为明确的监督来对任意不确定性进行建模。在我们的工作中,它代表了以输入图像为条件的预测的不确定性。
在这里插入图片描述
在这里插入图片描述

Uncertainty-Aware Learning(具有不确定性的学习)

伪装物体检测在整个图像中具有不同的学习困难。沿着物体边界的像素比远离伪装物体的背景像素更难区分。此外,伪装前景包含具有不同伪装水平的部分,其中一些部分易于识别,例如眼睛、嘴巴等,而另一些部分难以区分,例如身体区域具有与背景相似的外观。我们打算通过在我们的CODNet中建模不确定性意识,在整个图像中建模这种不同的学习难度。具体而言,受[47]的启发,我们提出训练具有不确定性感知结构损失的伪装对象检测网络:
在这里插入图片描述

损失函数

Thinking

还没写完,先就这

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/240737.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Stable Diffusion 基本原理

1 Diffusion Model的运作过程 输入一张和我们所需结果图尺寸一致的噪声图像,通过Denoise模块逐步减少noise,最终生成我们需要的效果图。 图中Denoise模块虽然是同一个,但是它会根据不同step的输入图像和代表noise严重程度的参数选择denoise的…

01背包详解,状态设计,滚动数组优化,通用问题求解

文章目录 0/1背包前言一、0/1背包的状态设计1、状态设计2、状态转移方程3、初始状态4、代码实现5、滚动数组优化二维优化为两个一维二维优化为一个一维,倒序递推 二、0/1背包的通用问题求最大值求最小值求方案数 0/1背包 前言 0/1包问题,作为动态规划问…

Python通过telnet批量管理配置华为交换机

名称:Python通过telnet批量管理配置华为交换机 测试工具:ensp, Visual Studio Code , Python3.8环境 时间:2023.12.23 个人备注:在NB 项目中,可以批量登录修改交换机配置,以此满足甲方爸爸的…

【Linux基础开发工具】gcc/g++使用make/Makefile

目录 前言 gcc/g的使用 1. 语言的发展 1.1 语言和编译器自举的过程 1.2 程序翻译的过程: 2. 动静态库的理解 Linux项目自动化构建工具-make/makefile 1. 快速上手使用 2. makefile/make执行顺序的理解 前言 了解完vim编辑器的使用,接下来就可以尝…

drawio绘制组织架构图和树形图

drawio绘制组织架构图和树形图 drawio是一款强大的图表绘制软件,支持在线云端版本以及windows, macOS, linux安装版。 如果想在线直接使用,则直接输入网址draw.io或者使用drawon(桌案), drawon.cn内部完整的集成了drawio的所有功能,并实现了云…

【一起学Rust | 框架篇 | Tauri2.0框架】Tauri2.0环境搭建与项目创建

文章目录 前言一、搭建 Tauri 2.0 开发环境二、创建 Tauri 2.0 项目1.创建项目2.安装依赖4. 编译运行 三、设置开发环境四、项目结构 前言 Tauri在Rust圈内成名已久,凭借Rust的可靠性,使用系统原生的Webview构建更小的App 以及开发人员可以灵活的使用各…

IDEA 中 Tomcat 日志乱码

1、服务器输出乱码 修改 File -> settings -> Editor -> General ->Console 中,utf-8改为GBK,反之改成utf-8 2、Tomcat Localhost Log 或者 Tomcat Catalina Log乱码 进入Tomcat 中的conf文件中的logging.properties 哪个有问题改哪个&…

虚拟机的下载、安装(模拟出服务器)

下载 vmware workstation(收费的虚拟机) 下载vbox 网址:Oracle VM VirtualBox(免费的虚拟机) 以下选择一个下载即可,建议下载vbox,因为是免费的。安装的时候默认下一步即可(路径最好…

【数据安全】Java AES加密和解密

自我介绍 做一个简单介绍,酒架年近48 ,有20多年IT工作经历,目前在一家500强做企业架构.因为工作需要,另外也因为兴趣涉猎比较广,为了自己学习建立了三个博客,分别是【全球IT瞭望】,【…

Kubernetes 架构原则和对象设计

什么是 Kubernetes Kubernetes 是谷歌开源的容器集群管理系统 • 基于容器的应用部署、维护和滚动升级; • 负载均衡和服务发现; • 跨机器和跨地区的集群调度; • 自动伸缩; • 无状态服务和有状态服务; • 插件机制…

fba海派和传统海运的区别,亚马逊 FBA货物包装技巧—站斧浏览器

fba海派和传统海运的区别 1、美国FBA海派是什么? 美国FBA海派即将商品通过海洋运输的方式运送到美国亚马逊FBA仓库的服务。这种方式主要适用于大批量或大件商品,因为相比其他物流方式,海派具备成本低和运载量大的优势。 2、传统海运是什么…

编译opencv和opencv_contrib

1 下载源码 下载opencv源码https://github.com/opencv/opencv 下载opencv源码https://github.com/opencv/opencv_contrib 2 开始编译 构建需要下载ffmpeg的包,cmake构建时会自动下载,但是比较满,这里可以从下面链接直接下载 https://downloa…

ECMAScript基础入门:从语法到应用

在此之前我以及发布过关于JavaScript基础知识点大家也可以参考 大家有关于JavaScript知识点不知道可以去 🎉博客主页:阿猫的故乡 🎉系列专栏:JavaScript专题栏 🎉ajax专栏:ajax知识点 🎉欢迎关注…

C++ Qt开发:Charts折线图绘制详解

Qt 是一个跨平台C图形界面开发库,利用Qt可以快速开发跨平台窗体应用程序,在Qt中我们可以通过拖拽的方式将不同组件放到指定的位置,实现图形化开发极大的方便了开发效率,本章将重点介绍QCharts折线图的常用方法及灵活运用。 折线图…

C++ map和vector向量使用方法

C map用法 C 中 map 提供的是一种键值对容器,里面的数据都是成对出现的,如下图:每一对中的第一个值称之为关键字(key),每个关键字只能在 map 中出现一次;第二个称之为该关键字的对应值。 map的使用 需要导入头文件 #include …

采用线性插值的方法 在n个坐标点的基础上 准备添加一个坐标点p 根据给出p的横坐标 计算出p的纵坐标 np.interp()

【小白从小学Python、C、Java】 【计算机等考500强证书考研】 【Python-数据分析】 采用线性插值的方法 在n个坐标点的基础上 准备添加一个坐标点p 根据给出p的横坐标 计算出p的纵坐标 np.interp() [太阳]选择题 下列选项正确的是: import numpy as np x np.arra…

[架构之路-264]:个性特征 - 到底什么才是工程师文化?

目录 前言: 一、三种类型的商业公司与生存法则 (1)运营或销售驱动型公司 (2)产品驱动型公司 (3)技术驱动型公司 二、工程师文化特征解读1 三、工程师文化特征解读2 (1&#…

解决Unity物体速度过快无法进行碰撞检测(碰撞检测穿透)

解决Unity物体速度过快无法进行碰撞检测(碰撞检测穿透) 一、解决碰撞检测穿透方法一Collision Detection碰撞检测总结: 二、解决碰撞检测穿透方法二 一、解决碰撞检测穿透方法一 首先我们知道只要是跟碰撞相关的基本都是离不开刚体 Rigidbod…

八大排序算法@直接插入排序(C语言版本)

目录 直接插入排序概念算法思想代码实现核心算法:直接插入排序的算法实现: 特性总结 直接插入排序 概念 算法思想 把待排序的记录按其关键码值的大小逐个插入到一个已经排好序的有序序列中,直到所有的记录插入完为止,得到一个新…

「C/C++ 01」 深拷贝和浅拷贝

目录 一、概念 1. 浅拷贝 2. 深拷贝 3. 深浅拷贝问题 4. 总结 二、在C的类中实现深拷贝 1. 拷贝构造函数 中实现深拷贝 a. 自己开辟一个新空间,然后将内容拷贝到新空间 b. 借助构造函数来实现深拷贝 2. operator 中实现深拷贝 a. 自己开辟一个新空间,…