小目标检测顶会新思路!最新成果刷爆遥感SOTA,参数小了18倍

遥感领域的小目标检测一直是个具有挑战性和趣味性的研究方向,同时也是顶会顶刊的常客。但不得不说,今年关于遥感小目标检测的研究热情尤其高涨,已经出现了很多非常优秀的成果。

比如SuperYOLO方法,通过融合多模态数据并执行高分辨率的目标检测,在大幅提高遥感图像中小目标的检测准确性和速度的同时,参数减少了18倍。

再比如结合顶流Mamba和YOLOv9的SOAR,在精度和效率方面都达到了SOTA,性能直接起飞,实力证明遥感小目标检测广泛的应用潜力和高精度的检测能力。

不过由于它的复杂性,遥感小目标检测还是有很多问题没有解决,但这也意味着还有不少创新空间等我们挖掘。为了方便大家找idea,我这边整理了9篇最新的遥感小目标检测论文,基本都有代码,强烈建议想发顶会的同学研读。

论文原文+开源代码需要的同学看文末

SuperYOLO: Super resolution assisted object detection in multimodal remote sensing imagery

方法:本文提出了一种名为SuperYOLO的准确且快速的遥感图像目标检测方法,通过融合多模态数据并利用辅助超分辨率学习实现对多尺度小目标的高分辨率检测,同时考虑检测准确性和计算成本,取得了优于现有模型的性能表现,具有较低的参数大小和计算代价。

创新点:

  • 通过引入一个简单而灵活的超分辨率(SR)分支,实现高分辨率(HR)特征表示的学习,从而能够在仅有低分辨率(LR)输入的情况下,轻松识别广阔背景中的小物体。

  • 提出了一种计算友好的像素级融合方法,以对称且紧凑的方式双向组合内部信息。与特征级融合相比,它在减少计算成本的同时不会损失准确性。

SOAR: Advancements in Small Body Object Detection for Aerial Imagery Using State Space Models and Programmable Gradients

方法:论文主要研究了在航空图像中小目标的检测,采用了SAHI框架结合YOLO v9和Vision Mamba模型,以及双向状态空间模型,有效解决了小目标被背景噪声遮挡的挑战,提高了检测精度和计算效率。

创新点:

  • 了在轻量级YOLO v9架构上使用SAHI框架,该框架利用可编程梯度信息来减少在顺序特征提取过程中通常遇到的巨大信息损失。

  • 采用了Vision Mamba模型,并结合了新颖的双向SSM进行有效的视觉上下文建模。这种模型结合了CNN的线性复杂度和Transformers的全局感受野,特别适用于遥感图像分类。

LR-FPN: Enhancing Remote Sensing Object Detection with Location Refined Feature Pyramid Network

方法:论文引入了一种新颖的位置细化特征金字塔网络(LR-FPN),增强了浅层位置信息的提取,并促进了细粒度上下文交互。LR-FPN通过浅层位置信息提取模块(SPIEM)和上下文交互模块(CIM),有效地利用了稳健的位置信息。

创新点:

  • 介绍了一种插拔式的位置精化特征金字塔网络(LR-FPN),以增强浅层位置信息的提取,并促进细粒度的上下文交互。

  • 引入了一个上下文交互模块(CIM),用于有效地处理空间和通道信息的交互。通过使用深度卷积和空洞深度卷积进行通道内的本地空间信息交互,并通过空洞深度卷积来处理非局部空间交互的挑战,有效地扩大了感受野并增强了空间信息的非局部交互。

HCF-Net: Hierarchical Context Fusion Network for Infrared Small Object Detection

方法:论文提出了一种名为HCF-Net的深度学习方法,通过多个实用模块显著提高了红外小目标检测性能。该方法包括并行化的自适应注意力模块(PPA)、维度感知选择融合模块(DASI)和多膨胀通道细化模块(MDCR)。

创新点:

  • 提出了HCF-Net,这是一种从头开始训练的、层次化的上下文融合网络,用于红外小目标检测。通过多个实用模块,HCF-Net显著提高了红外小目标检测性能。

  • HCF-Net中的模块包括并行化的区域感知注意力模块(PPA)、维度感知的选择性融合模块(DASI)和多倍扩张通道细化器模块(MDCR)。这些模块通过不同的策略和技术选择,有效地解决了红外小目标检测中的困难和挑战。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“遥感小目标”获取全部论文+开源代码

码字不易,欢迎大家点赞评论收藏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/879339.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【重学 MySQL】二十八、SQL99语法新特性之自然连接和 using 连接

【重学 MySQL】二十八、SQL99语法新特性之自然连接和 using 连接 自然连接(NATURAL JOIN)USING连接总结 SQL99语法在SQL92的基础上引入了一些新特性,其中自然连接(NATURAL JOIN)和USING连接是较为显著的两个特性。 自…

数据结构(14)——哈希表(1)

欢迎来到博主的专栏:数据结构 博主ID:代码小豪 文章目录 哈希表的思想映射方法(哈希函数)除留余数法 哈希表insert闭散列负载因子扩容find和erase 哈希表的思想 在以往的线性表中,查找速度取决于线性表是否有序&#…

知识库管理系统在企业数字化转型中的作用

引言 在数字化转型的浪潮中,企业正以前所未有的速度重塑其业务模式、运营流程和组织架构,以适应快速变化的市场环境和客户需求。这一过程中,知识库管理系统作为信息整合与知识共享的核心平台,发挥着举足轻重的作用,不…

【解决】AnimationCurve 运行时丢失数据问题

开发平台:Unity 2022 编程平台:Visual Studio 编程语言:CSharp   一、问题背景 如上图所示的 GracityComponent 组件中,引用 AnimationCurve 作为可调属性。但在实际使用中出现数据丢失问题。大致为以下两种情况: 运…

【重学 MySQL】二十七、七种 join 连接

【重学 MySQL】二十七、七种 join 连接 union 的使用UNION 的基本用法示例UNION ALL 的用法 七种 join 连接代码实现语法格式小结 union 的使用 UNION 在 SQL 中用于合并两个或多个 SELECT 语句的结果集,并默认去除重复的行。如果希望包含重复行,可以使…

RNN发展(RNN/LSTM/GRU/GNMT/transformer/RWKV)

RNN到GRU参考: https://blog.csdn.net/weixin_36378508/article/details/115101779 tRANSFORMERS参考: seq2seq到attention到transformer理解 GNMT 2016年9月 谷歌,基于神经网络的翻译系统(GNMT),并宣称GNMT在多个主…

java程序员入行科目一之CRUD轻松入门教程(二)

封装工具类 封装获取连接&释放资源操作 在实际使用JDBC的时候,很多操作都是固定的,没有必要每次都去注册驱动,获取链接对象等等。 同样,释放资源的close操作也可以封装一下 下面是封装好的具体工具类 package com.jimihua.u…

海外云手机是否适合运营TikTok?

随着科技的迅猛发展,海外云手机逐渐成为改变工作模式的重要工具。这种基于云端技术的虚拟手机,不仅提供了更加便捷、安全的使用体验,还在电商引流和海外社媒管理等领域展示了其巨大潜力。那么,海外云手机究竟能否有效用于运营TikT…

mosh java 2.4 inheritance继承

1.面向对象编程的第三个特点 继承 继承的好处 java不能继承多个父级 代码文件结构 1.main.java package org.example; //package org.codewithme;//import org.example.UIControl;//TIP To <b>Run</b> code, press <shortcut actionId"Run"/> or /…

3C电子胶黏剂在手机制造方面有哪些关键的应用

3C电子胶黏剂在手机制造方面有哪些关键的应用 3C电子胶黏剂在手机制造中扮演着至关重要的角色&#xff0c;其应用广泛且细致&#xff0c;覆盖了手机内部组件的多个层面&#xff0c;确保了设备的可靠性和性能。以下是电子胶在手机制造中的关键应用&#xff1a; 手机主板用胶&…

率先搭载存内计算AI芯片,维迈通引领骑行通讯降噪革新

近日&#xff0c;高端骑行头盔耳机领导品牌维迈通&#xff08;VIMOTO&#xff09;三款新品XR、V10S、V10X全平台正式发售&#xff0c;创新搭载了知存科技&#xff08;Witmem&#xff09;高能效存内计算AI芯片&#xff0c;为骑行爱好者带来更极致的AI降噪体验。 作为一家专注摩托…

状压DP

状压DP 对于数据范围n<20的可以考虑状压DP 1.蒙德里安的梦想 题目描述 求把 N M NM NM 的棋盘分割成若干个 12 的的长方形&#xff0c;有多少种方案。 例如当$ N2&#xff0c;M4$ 时&#xff0c;共有 5 种方案。当 N 2 &#xff0c; M 3 N2&#xff0c;M3 N2&…

windows 创建新用户,并分配到指定组

右击电脑 -> 点击管理 在右边右击&#xff0c;选择新用户&#xff0c;输入相关信息创建 创建用户后&#xff0c;选择用户&#xff0c;右击&#xff0c;选择属性&#xff0c;添加 点击高级 点击立即查找&#xff0c;可以搜索出所有可用的组&#xff0c;为其选择即可

Java XML

1、XML文件介绍 配置文件&#xff1a;用来保存设置的一些东西。 拿IDEA来举例&#xff0c;比如设置的背景图片&#xff0c;字体信息&#xff0c;字号信息和主题信息等等。 &#xff08;1&#xff09;以前是用txt保存的&#xff0c;没有任何优点&#xff0c;而且不利于阅读&a…

停车位检测-停车场车位识别

YOLO Parking Spot 概述 停车场获取的图像训练了四个YOLO模型来检测车辆。目标是收集信息&#xff0c;并可能开发一种停车解决方案以改善交通流量并优化空间利用率。通过识别汽车&#xff0c;我们生成了一份报告&#xff0c;其中包含图像细节&#xff0c;如可用停车位的数量、…

官宣:Zilliz 在亚马逊云科技中国区正式开服!

01 Zilliz Cloud 正式上线亚马逊云科技宁夏区服务 9 月 4 日&#xff0c;Zilliz 正式官宣&#xff0c; Zilliz Cloud 正式上线亚马逊云科技在宁夏区的云服务。至此&#xff0c;Zilliz Cloud 已实现全球 5 大云 19 个节点 的全覆盖&#xff0c;成为全球首个提供海内外多云服务的…

《机器学习》—— SVD奇异值分解方法对图像进行压缩

文章目录 一、SVD奇异值分解简单介绍二、代码实现—SVD奇异值分解方法对图像进行压缩 一、SVD奇异值分解简单介绍 SVD&#xff08;奇异值分解&#xff09;是一种在信号处理、统计学、线性代数、机器学习等多个领域广泛应用的矩阵分解方法。它将任何 mn 矩阵 A 分解为三个特定矩…

从0书写一个softmax分类 李沐pytorch实战

输出维度 在softmax 分类中 我们输出与类别一样多。 数据集有10个类别&#xff0c;所以网络输出维度为10。 初始化权重和偏置 torch.norma 生成一个均值为 0&#xff0c;标准差为0.01,一个形状为size(num_inputs, num_outputs)的张量偏置生成一个num_outputs 10 的一维张量&a…

Kubernetes从零到精通(10-服务Service)

Service简介 Deployment这种工作负载能管理我们应用Pod的副本数&#xff0c;并实现动态的创建和销毁&#xff0c;所以Pod本身是临时资源&#xff08;IP随时可能变化&#xff09;。现在如果某组Pod A需要访问另一组Pod B&#xff0c;A就需要在应用的配置参数里动态跟踪并更改B的…

【数学建模】相关系数

第一部分&#xff1a;相关系数简介 总体与样本&#xff1a; 总体&#xff1a;指研究对象的全体&#xff0c;比如全国人口普查数据。样本&#xff1a;从总体中抽取的一部分个体&#xff0c;如通过问卷调查收集的学生数据。 皮尔逊相关系数&#xff1a; 总体皮尔逊相关系数&…