《光学遥感图像中显著目标检测的多内容互补网络》2021-9

一、简介
在本文中,我们提出了一种新的多内容互补网络 (MCCNet) 来探索 RSI-SOD 的多内容互补性。具体来说,MCCNet 基于通用的编码器-解码器架构,并包含一个名为 multi-content complementation module (MCCM) 的新型关键组件,它将编码器和解码器连接起来。在 MCCM 中,我们考虑了对 RSI-SOD 至关重要的多种类型的特征,包括前景特征、边缘特征、背景特征和全局图像级特征,并利用它们之间的内容互补性,通过注意力机制突出 RSI 特征中不同尺度上的显著区域。此外,我们在训练阶段全面引入了像素级、映射级和度量感知损失。
我们首先将前台内容集成到我们的 MCCM 中,我们引入了边缘内容,我们采用边缘监督来生成边缘注意力图,用于特征中的边缘激活。对于 RSI-SOD,我们认为除了前景边缘之外,背景也很重要。在这里,我们考虑光学 RSI 的复杂背景内容。以上三种内容详细介绍了本地信息。我们整合了全局图像级内容,以实现全面的内容补充。通过这种方式,我们的 MCCM 可以同时捕获本地和全局内容,这对于准确感知突出区域和区分杂乱的背景区域非常有效。此外,为了提高 MCCM 的稳健性,我们在多个特征尺度上实施了 MCCM。我们将 MCCM 部署在编码器-解码器网络中,这是 NSI-SOD 的通用骨干。

二、文章提到的前人的技术和论文

  • Multilevel/scale fusion(多层 /尺度融合):在显著目标检测中,不同层次或尺度的特征包含不同的信息。例如,浅层特征可能包含图像的细节和边缘信息,而深层特征则更侧重于语义信息。通过多层 /尺度融合技术,可以将不同层次或尺度的特征进行组合,以获得更全面和准确的特征表示。如在一些方法中,会将卷积神经网络中不同层的特征图进行融合,使网络能够同时利用低层次的细节信息和高层次的语义信息来更好地检测显著目标,提高对不同大小和复杂程度目标的检测能力。
  • Edge guidance/preservation(边缘引导 /保留):边缘是物体的重要边界信息,对于确定显著目标的形状和位置至关重要。边缘引导技术利用图像中的边缘信息来指导显著目标的检测过程,例如通过将边缘区域的特征与其他区域特征进行特殊处理或加权,使网络更关注边缘附近的区域,从而更准确地勾勒出显著目标的轮廓。边缘保留则侧重于在特征处理过程中尽量保持边缘信息的完整性,防止边缘信息在卷积、池化等操作中丢失或模糊,确保网络能够利用清晰的边缘特征进行目标检测。
  • Attention(注意力机制):注意力机制使网络能够动态地聚焦于图像中的关键区域或特征。在显著目标检测中,它可以帮助网络自动学习到哪些区域更有可能是显著目标,从而分配更多的计算资源和权重给这些区域。例如,通过像素级或区域级的注意力机制,网络可以根据图像内容的不同,对前景区域、高对比度区域或具有特定纹理的区域等给予更高的关注,增强这些区域在特征表示中的重要性,提高显著目标检测的准确性和效率。
  • Complementary losses(互补损失):在训练过程中,单一的损失函数可能无法全面地衡量模型的性能。互补损失通过引入多种不同类型的损失函数来共同监督模型的训练。例如,除了常用的二元交叉熵(BCE)损失用于衡量预测的显著图与真实标签之间的差异外,还可能引入如交并比(IoU)损失来关注目标区域的重叠程度,或F - measure损失来综合考虑精度和召回率等指标。这些不同的损失函数从不同角度对模型进行约束和优化,使模型能够学习到更全面和准确的显著目标检测能力,避免模型在某些方面的过拟合或欠拟合
  • LVNet2019 将多分辨率输入融合在嵌套结构中,以感知不同大小的物体
  • PDFNet2020 集成了来自五个分支的 5 个尺度特征,以实现全面检测
  • DAFNet2021 不仅使用突出的边缘映射作为额外的监督,而且还以密集流畅的方式进行关注
  • 与DAFNet类似,EMFINet2021采用三种不同分辨率的光学RSI作为输入,但与DAFNet不同的是,它采用边缘监督来生成具有边缘感知约束的特征,并引入混合损失来推断具有形状边界的显著对象
    三、模型结构
    在这里插入图片描述

在这里插入图片描述

四、总结
主要是学习提出的MCCM模块,集成了前景,背景,全局,边缘的特征。学会了怎么引入边缘特征

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/66128.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【STM8S】STM8S之自定义短、长、连击按键

本文最后修改时间:2018年10月22日 01:57 一、本节简介 本文介绍STM8S系列如何实现按键的短按、长按、连击。 二、实验平台 编译软件:IAR for STM8 1.42.2 硬件平台:stm8s003f3p6开发板 仿真器:ST-LINK 库函数版本&#xff1a…

数据库(MySQL)练习

数据库(MySQL)练习 一、练习1.15练习练习 二、注意事项2.1 第四天 一、练习 1.15练习 win11安装配置MySQL超详细教程: https://baijiahao.baidu.com/s?id1786910666566008458&wfrspider&forpc 准备工作: mysql -uroot -p #以管理…

【深度学习地学应用|滑坡制图、变化检测、多目标域适应、感知学习、深度学习】跨域大尺度遥感影像滑坡制图方法:基于原型引导的领域感知渐进表示学习(一)

【深度学习地学应用|滑坡制图、变化检测、多目标域适应、感知学习、深度学习】跨域大尺度遥感影像滑坡制图方法:基于原型引导的领域感知渐进表示学习(一) 【深度学习地学应用|滑坡制图、变化检测、多目标域适应、感知学习、深度学习】跨域大…

《C++11》并发库:简介与应用

在C11之前,C并没有提供原生的并发支持。开发者通常需要依赖于操作系统的API(如Windows的CreateThread或POSIX的pthread_create)或者第三方库(如Boost.Thread)来创建和管理线程。这些方式存在以下几个问题: …

了解Node.js

Node.js是一个基于V8引擎的JavaScript运行时环境,它允许JavaScript代码在服务器端运行,从而实现后端开发。Node.js的出现,使得前端开发人员可以利用他们已经掌握的JavaScript技能,扩展技能树并成为全栈开发人员。本文将深入浅出地…

js解决 Number失精度问题

const updatePromises adinfo.rows.map(async item > {const cwf await uniCloud.httpclient.request("https://api.oceanengine.com/open_api/v3.0/project/list/", {method: GET,data: {advertiser_id: item.account_id},// 1. 指定text数据格式dataType: tex…

实力认证 | 海云安入选《信创安全产品及服务购买决策参考》

近日,国内知名安全调研机构GoUpSec发布了2024年中国网络安全行业《信创安全产品及服务购买决策参考》,报告从产品特点、产品优势、成功案例、安全策略等维度对各厂商信创安全产品及服务进行调研了解。 海云安凭借AI大模型技术在信创安全领域中的创新应用…

windows系统“GameInputRedist.dll”文件丢失或错误导致游戏运行异常如何解决?windows系统DLL文件修复方法

GameInputRedist.dll是存放在windows系统中的一个重要dll文件,缺少它可能会造成部分游戏不能正常运行。当你的电脑弹出提示“无法找到GameInputRedist.dll”或“计算机缺少GameInputRedist.dll”等错误问题,请不用担心,我们将深入解析DLL文件…

概率论考前一天

判断是不是分布函数:单调不减,右连续,F负无穷为0, F正无穷为1 判断是不是密度函数:非负性(函数任意地方都大于0),规范:积分为1

FPGA工程师成长四阶段

朋友,你有入行三年、五年、十年的职业规划吗?你知道你所做的岗位未来该如何成长吗? FPGA行业的发展近几年是蓬勃发展,有越来越多的人才想要或已经踏进了FPGA行业的大门。很多同学在入行FPGA之前,都会抱着满腹对职业发…

springCloudGateway+nacos自定义负载均衡-通过IP隔离开发环境

先说一下想法,小公司开发项目,参考若依框架使用的spring-cloud-starter-gateway和spring-cloud-starter-alibaba-nacos, 用到了nacos的配置中心和注册中心,有多个模块(每个模块都是一个服务)。 想本地开发,…

向量数据库如何助力Text2SQL处理高基数类别数据

01. 导语 Agent工作流和 LLMs (大语言模型)的出现,让我们能够以自然语言交互的模式执行复杂的SQL查询,并彻底改变Text2SQL系统的运行方式。其典型代表是如何处理High-Cardinality Categorical Data (高基数类别数据&am…

qBittorent访问webui时提示unauthorized解决方法

现象描述 QNAP使用Container Station运行容器,使用Docker封装qBittorrent时,访问IP:PORT的方式后无法访问到webui,而是提示unauthorized,如图: 原因分析 此时通常是由于设备IP与qBittorrent的ip地址不在同一个网段导致…

工程水印相机结合图纸,真实现场时间地点,如何使用水印相机,超简单方法只教一次!

在工程管理领域,精准记录现场信息至关重要。水印相机拍照功能,为工程人员提供了强大的现场信息记录工具,助力工程管理和统计工程量,更可以将图片分享到电脑、分享给同事,协同工作。 一、打开图纸 打开手机版CAD快速看图…

GO语言实现KMP算法

前言 本文结合朱战立教授编著的《数据结构—使用c语言(第五版)》(以下简称为《数据结构(第五版)朱站立》)中4.4.2章节内容编写,KMP的相关概念可参考此书4.4.2章节内容。原文中代码是C语言&…

LeetCode 热题 100_从前序与中序遍历序列构造二叉树(47_105_中等_C++)(二叉树;递归)

LeetCode 热题 100_从前序与中序遍历序列构造二叉树(47_105) 题目描述:输入输出样例:题解:解题思路:思路一(递归): 代码实现代码实现(思路一(递归…

文档智能:OCR+Rocketqa+layoutxlm <Rocketqa>

此次梳理Rocketqa,个人认为该篇文件讲述的是段落搜索的改进点,关于其框架:粗检索 重排序----(dual-encoder architecture),讲诉不多,那是另外的文章; 之前根据文档智能功能&#x…

ubuntu官方软件包网站 字体设置

在https://ubuntu.pkgs.org/22.04/ubuntu-universe-amd64/xl2tpd_1.3.16-1_amd64.deb.html搜索找到需要的软件后,点击,下滑, 即可在Links和Download找到相关链接,下载即可, 但是找不到ros的安装包, 字体设…

使用 WPF 和 C# 绘制覆盖网格的 3D 表面

此示例展示了如何使用 C# 代码和 XAML 绘制覆盖有网格的 3D 表面。示例使用 WPF 和 C# 将纹理应用于三角形展示了如何将纹理应用于三角形。此示例只是使用该技术将包含大网格的位图应用于表面。 在类级别,程序使用以下代码来定义将点的 X 和 Z 坐标映射到 0.0 - 1.…

[Do374]Ansible一键搭建sftp实现用户批量增删

[Do374]Ansible一键搭建sftp实现用户批量增删 1. 前言2. 思路3. sftp搭建及用户批量新增3.1 配置文件内容3.2 执行测试3.3 登录测试3.4 确认sftp服务器配置文件 4. 测试删除用户 1. 前言 最近准备搞一下RHCA LV V,外加2.9之后的ansible有较大变化于是练习下Do374的课程内容. 工…