YOLOv9最新改进系列:融合空间信息关注机制(SimAM)于YOLOv9网络,在通道之间和空间位置之间建立更加准确的关联,助力YOLOv9有效涨点!!!

YOLOv9最新改进系列:融合空间信息关注机制(SimAM)于YOLOv9网络,在通道之间和空间位置之间建立更加准确的关联,助力YOLOv9有效涨点!!!

在此之前!先恭喜两位家人!!!!

第一位优秀的家人~
请添加图片描述第二位优秀的家人~

请添加图片描述

YOLOv9原文链接戳这里,原文全文翻译请关注B站Ai学术叫叫首er

B站全文戳这里!

详细的改进教程以及源码,戳这!戳这!!戳这!!!B站:AI学术叫叫兽 源码在工房的链接中,动态中也有链接,感谢支持!祝科研遥遥领先!

Involution新卷积网络算子提出原文

YOLOv9最新改进系列:融合空间信息关注机制(SimAM)于YOLOv9网络,在通道之间和空间位置之间建立更加准确的关联,助力YOLOv9有效涨点!!!

  • YOLOv9最新改进系列:融合空间信息关注机制(SimAM)于YOLOv9网络,在通道之间和空间位置之间建立更加准确的关联,助力YOLOv9有效涨点!!!
  • 摘要
  • 1 介绍
  • 2 相关工作
  • 3 结论
  • 四 修改步骤!
    • 4.1 修改YAML文件
    • 4.2 新建.py
    • 4.3 修改tasks.py
  • 五、验证是否成功即可


SimAM: A Simple, Parameter-Free Attention Module for
Convolutional Neural Networks(提出原文戳这)

详细的改进教程以及源码,戳这!戳这!!戳这!!!B站:AI学术叫叫兽 源码在相簿的链接中,动态中也有链接,感谢支持!祝科研遥遥领先!
截止到发稿时,B站YOLOv9最新改进系列的源码包,已更新了21种的改进!自己排列组合2-4种后,考虑位置不同后可排列组合上千种!!专注AI学术,关注B站博主:Ai学术叫叫兽er!

摘要

在本文中,我们提出了一个概念上简单但非常有效的卷积神经网络(ConvNets)注意力模块。 与现有的通道和空间注意力模块相比,我们的模块为层中的特征图推断 3D 注意力权重,而不向原始网络添加参数。 具体来说,我们基于一些著名的神经科学理论,提出优化能量函数来找出每个神经元的重要性。 我们进一步推导了能量函数的快速封闭式解决方案,并表明该解决方案可以用不到十行代码来实现。 该模块的另一个优点是,大多数算子是根据定义的能量函数的解来选择的,避免了过多的结构调整工作。 对各种视觉任务的定量评估表明,所提出的模块灵活有效,可以提高许多ConvNet的表示能力。

在这里插入图片描述图 1. 不同网络获得的特征激活的可视化。 所有比较的网络均在一致的设置下在 ImageNet(Russakovsky 等人,2015)上进行训练。 这些特征是在验证集上提取的,并由 Grad-CAM 显示(Selvaraju 等人,2017)。 我们的 SimAM 帮助网络关注一些靠近下图所示图像标签的主要区域。

受人脑注意力机制的启发,
1我们提出了一个具有完整 3D 权重的注意力模块,并设计了一个能量函数来计算权重。
2 我们推导了能量函数的封闭式解,该解加速了重量计算并允许整个模块的轻量级形式。
3 我们将所提出的模块集成到一些众所周知的网络中,并在各种任务上对其进行评估。 我们的模块在准确性、模型大小和速度方面优于其他流行模块。

1 介绍

在大规模数据集(例如 ImageNet(Russakovsky 等人,2015))上训练的卷积神经网络(ConvNet)极大地提高了许多视觉任务的性能,例如图像分类(Krizhevsky 等人,2012;Simonyan 和 Zisserman) ,2014;He 等人,2016b;Szegedy 等人,2015;Sandler 等人,2018),物体检测(Ren 等人,2015;Liu 等人,2016) 等,2017)和视频理解(Feichtenhofer 等,2016;Wang 等,2018a)。 多项研究表明,更好的 ConvNet 结构可以显着提高各种问题的性能。 因此,构建强大的ConvNet是视觉研究中的一项重要任务。 现代 ConvNet 通常具有多个阶段,每个阶段由几个块组成。 这样的块由几个算子构建,如卷积、池化、激活或一些定制的元结构(在本文中称为模块)。 最近,许多工作不再像(Krizhevsky et al., 2012)那样设计整个架构,而是专注于构建高级模块以提高 ConvNet 的表示能力。 堆叠卷积 (Simonyan & Zisserman, 2014)、残差单元 (He et al., 2016b;a; Zagoruyko & Komodakis, 2016; Sandler et al., 2018) 和密集连接 (Huang et al., 2017; 2018) 是 其中最具代表性的,在现有架构中得到了广泛的应用。 然而,设计这些模块需要丰富的专业知识和大量的时间。 为了规避这一点,许多研究人员寻求一些搜索策略来自动构建架构(Zoph & Le,2016;Liu et al.,2018b;Dong & Yang,2019;Tan & Le,2019;Guo et al.,2020;Liu 等人,2019;Feichtenhofer,2020;Tan 等人,2020)。 除了设计复杂的模块之外,另一条研究重点是构建即插即用模块(Hu et al., 2018b; Woo et al., 2018; Cao et al., 2020; Lee et al., 2019; Wang et al., 2019) ., 2020; Yang et al., 2020)可以细化块内的卷积输出,并使整个网络能够学习更多信息特征。 例如,挤压和激励(SE)模块(Hu et al., 2018b)允许网络捕获任务相关特征(参见图 1 中的“山帐篷”)并抑制许多背景激活(参见中的“钢拱桥”)。 图1)。 该模块独立于网络架构,因此可以插入广泛的网络中,例如 VGG (Simonyan & Zisserman, 2014)、ResNets (He et al., 2016b) 和 ResNeXts (Xie et al., 2017) 。 最近,SE 模块作为 AutoML 的一个组件包含在内,以搜索更好的网络结构(Howard 等人,2019 年;Tan & Le,2019 年)。 然而,现有的注意力模块有两个问题。 首先,它们只能沿着通道或空间维度细化特征,限制了它们学习跨通道和空间变化的注意力权重的灵活性。 其次,它们的结构是由一系列复杂因素构建的,例如池化的选择。 我们通过提出一个基于完善的神经科学理论的模块来解决这些问题。 具体来说,为了使网络学习更具辨别力的神经元,我们建议直接从当前神经元推断 3D 权重(即考虑空间和通道维度),然后依次细化这些神经元。 为了有效地推断此类 3-D 权重,我们定义了一个由神经科学知识指导的能量函数,并得出了一个封闭式解决方案。 如图 1 所示,我们的模块帮助网络捕获许多与图像一致的有价值的线索

2 相关工作

在本节中,我们将简要讨论网络架构和即插即用注意力模块的代表性工作。 网络架构。 2012 年,发布了现代深度卷积网络 AlexNet(Krizhevsky et al., 2012),用于大规模图像分类。 它是一个简单的前馈结构,类似于 LeNet 中的设置(LeCun 等人,1998)。 之后,人们提出了多种方法来增强卷积网络的能力。 一些工作侧重于寻找最佳滤波器形状(Zeiler & Fergus,2014;Chatfield 等人,2014),而其他一些方法尝试设计更深的网络。 例如,VGG (Simonyan & Zisserman, 2014) 和 Inception Net (Szegedy et al., 2015) 使用堆叠卷积来降低梯度消失/爆炸的风险 (Bengio et al., 1994; Glorot & Bengio, 2010)。 接下来,ResNet(He et al., 2016b)和 Highway network(Srivastava et al., 2015)在每个块内添加从输入到输出的快捷连接。 快捷连接使 ConvNet 能够扩展到数百层。 他们的结果表明,增加网络深度可以大大提高卷积网络的表示能力。 除了网络深度之外,一些工作建议增加滤波器的数量(Zagoruyko & Komodakis,2016)以获得更宽的块,在每个块内添加更多连接(Huang et al.,2017),或者探索组/深度明智的卷积( 谢等人,2017;Chollet,2017)。 最近,一系列工作使用 AutoML (Zoph & Le, 2016; Liu et al., 2018b;a; Tan et al., 2019; Howard et al., 2019; Wu et al., 2019) 来保存手册 网络设计方面的努力。 与上述工作不同,我们的目标是设计一个轻量级的即插即用模块。 该模块可用于许多ConvNet,以进一步提高其在各种任务中的性能,而无需对架构进行大的改变。 注意和重新校准模块。 之前的作品还设计了一些细化特征图的计算模块。 它们通常被称为注意力模块或重新校准模块。 为了简单起见,我们在本文中将它们称为注意力模块。 事实上,人类注意力是最重要的选择机制之一,它优先考虑与任务相关的信息并减弱不相关的信号(Reynolds & Chelazzi,2004;Chun 等,2011)。 人类视觉处理中的注意力机制激发研究人员在卷积网络中设计类似的注意力模块。 一项代表性工作,挤压和激励(SE)(Hu et al., 2018b),通过以下方式学习不同通道的重要性:首先从全局视图中捕获一些上下文线索,然后使用两个完全连接的层来模拟通道之间的交互。 输出又用于在通道级别完善这些功能。 该模块通过其他方法进一步扩展,例如,使用卷积聚合器捕获全局上下文(Hu et al., 2018a)、学习与基于通道的卷积的交互(Wang et al., 2020)、添加空间注意力(Woo 等人,2018),合并远程依赖关系(Cao 等人,2020;Wang 等人,2018b),统一注意力和标准化过程(Li 等人,2019a),或利用该特征的风格线索( 李等人,2019)。 然而,所有这些方法都平等地对待一个通道中的所有神经元或一个空间位置上的所有神经元,因此它们无法有效地计算真实的 3-D 权重。 此外,他们计算注意力权重的算法大多是手工制作的,需要大量的计算能力。 相比之下,我们基于一些著名的神经科学理论来设计我们的模块,这更具可解释性。 值得注意的是,一些模块也受到神经科学理论的启发,例如自适应上下文驱动的卷积(Lin et al., 2020)和选择性内核的感受野调整(Li et al., 2019b)。 与它们不同的是,我们的模块基于从哺乳动物大脑观察到的空间抑制,并将重量生成公式化为能量函数。 导出了该能量函数的封闭式解。 由于快速的封闭式解决方案,我们的模块没有引入额外的参数,这是与以前的作品不同的引人注目的属性。

详细方法请家人们仔细研读原文一手资料!!!

3 结论

在本文中,我们受到哺乳动物大脑神经科学理论的启发,提出了一种新的注意力模块 - SimAM。 特别是,我们基于完善的空间抑制理论,设计了能量函数来实现该理论。 我们还得出了该函数的一个简单解决方案,其中该函数进一步用作特征图中每个神经元的注意力重要性。 我们的注意力模块是在这个能量函数的指导下实现的,避免了太多的启发式方法。 进行了大量的实验来验证所提出的 SimAM 的有效性和效率。 我们的结果表明,针对不同视觉任务,所提出的 SimAM 与各种网络中的其他注意力模块的性能相当。

四 修改步骤!

4.1 修改YAML文件

详细的改进教程以及源码,戳这!戳这!!戳这!!!B站:AI学术叫叫兽 源码在相簿的链接中,动态中也有链接,感谢支持!祝科研遥遥领先!

4.2 新建.py

详细的改进教程以及源码,戳这!戳这!!戳这!!!B站:AI学术叫叫兽er 源码在相簿的链接中,动态中也有链接,感谢支持!祝科研遥遥领先!

4.3 修改tasks.py

详细的改进教程以及源码,戳这!戳这!!戳这!!!B站:AI学术叫叫兽er 源码在相簿的链接中,动态中也有链接,感谢支持!祝科研遥遥领先!

五、验证是否成功即可

执行命令

python train.py

改完收工!
关注B站:Ai学术叫叫兽er
从此走上科研快速路
遥遥领先同行!!!!

详细的改进教程以及源码,戳这!戳这!!戳这!!!B站:AI学术叫叫兽er 源码在相簿的链接中,动态中也有链接,感谢支持!祝科研遥遥领先!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/836224.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

WEB后端复习——Servlet

Servlet是运行在Web服务器或应用服务器上的java程序,它是一个中间层,负责连接来自web浏览器或其他HTTP客户程序和[HTTP服务器]上应用程序 Servlet执行下面的任务: 1)读取客户发送的显示数据。 2)读取由浏览器发送的隐式请求数据。…

JavaWeb文件上传/下载(Servlet)

效果 文件下载 文件上传 项目概述 Jakarta EE9&#xff0c;Web项目 项目文件结构 0 maven依赖&#xff0c;资源文件 <!-- lombok插件--> <dependency><groupId>org.projectlombok</groupId><artifactId>lombok</artifactId&g…

C++STL初阶(1):string的使用及初阶原理

此文作为学习stl的笔记&#xff0c;许多普及、概念性的知识点将不再罗列&#xff08;如stl的发展、背景等&#xff09; 便于读者作为复习等方法了解。 0.STL简介&#xff08;笔记向&#xff09; STL不是祖师爷本贾尼实现的&#xff0c;是在惠普实验室中实现的。其作为一个数据结…

NASA数据集——2002-2011年全球18.7 至 89.0 千兆赫的亮度温度、海冰浓度和海冰积雪深度三级网格产品(AE_SI12)数据

AMSR-E/Aqua Daily L3 12.5 km Brightness Temperature, Sea Ice Concentration, & Snow Depth Polar Grids V003 三级网格产品&#xff08;AE_SI12&#xff09;包括 18.7 至 89.0 千兆赫的亮度温度、海冰浓度和海冰积雪深度。 简介 美国国家航空航天局地球观测系统 Aqu…

数组实现循环队列

1、分析 循环队列最主要的特点为当前面的空间被pop后&#xff0c;后面的数据可以插入到前面空余的数据中去&#xff1b; 所以最难的部分为判断什么时候为空什么时候为满&#xff1a; a、空满问题 我们先来分析当数据满时&#xff0c;head和tail相等&#xff08;tail认为是指…

Android 按键消息流程源码分析

在Android系统中&#xff0c;键盘按键事件是由SystemServer服务来管理的&#xff1b;然后在以消息的形式分发给应用程序处理。产生键盘按键事件则是有Linux kernel的相关驱动来实现。键盘消息有别于其他类型的消息&#xff1b;需要从Linux kernel drivers产生由上层APP来处理。…

在做题中学习(57):寻找数组的中心下标

724. 寻找数组的中心下标 - 力扣&#xff08;LeetCode&#xff09; 解法&#xff1a;前缀和后缀和 思路&#xff1a;要看一个数是不是中心下标&#xff0c;就看他前面数的和 与 后面数的和 相不相等。 1.i前面数的和&#xff0c;是[0,i-1] 的前缀和&#xff0c;i后面数的和&am…

综合性练习(验证码案例)

目录 一、需求 二、准备工作 三、约定前后端交互接口 1、需求分析 2、接口定义 四、Hutool工具介绍 1、引入依赖 2、测试使用Hutool生成验证码 五、实现服务器端代码 代码解读&#xff1a; 六、调整前端页面代码 七、运行测试 随着安全性的要求越来越高&#xff0c…

软件体系结构论述

一、软件危机 1.软件成本日益增长 2.开发进度难以控制 3.软件质量差 4.软件维护困难 软件危机的原因 1.用户需求不明确 2.缺少正确的理论 3.软件规模大 4.软件复杂度高 如何克服软件危机 用工程&#xff0c;科学&#xff0c;数学的原则和方法…

Linux 第二十八章

&#x1f436;博主主页&#xff1a;ᰔᩚ. 一怀明月ꦿ ❤️‍&#x1f525;专栏系列&#xff1a;线性代数&#xff0c;C初学者入门训练&#xff0c;题解C&#xff0c;C的使用文章&#xff0c;「初学」C&#xff0c;linux &#x1f525;座右铭&#xff1a;“不要等到什么都没有了…

欢乐钓鱼大师攻略,怎么获取道具?

在《欢乐钓鱼大师》的游戏世界中&#xff0c;道具是提升钓鱼体验、解锁新功能以及完成挑战的关键。通过多种方式获取道具&#xff0c;能够帮助玩家更好地探索游戏世界、挑战自我&#xff0c;以及与其他玩家展开竞争。以下是关于如何获取道具的详细攻略&#xff0c;让你能够在游…

proteus示波器不弹出来

运行后示波器没有弹出来 点击调试&#xff08;Debug&#xff09;在点击Digital Oscilloscope 完成

Flutter-加载中动画

效果 考察内容 AnimationControllerTweenAnimatedBuilderTransformMatrix4 实现 ///源码&#xff1a;https://github.com/yixiaolunhui/flutter_xy class LoadingView extends StatefulWidget {const LoadingView({Key? key}) : super(key: key);overrideState<LoadingV…

探索循环购模式:消费返利与积分机制的创新融合

大家好&#xff0c;我是吴军&#xff0c;今天非常荣幸能与大家分享一种别具一格的商业模式——循环购模式。这种商业模式在近年来逐渐崭露头角&#xff0c;受到了广大消费者的热烈追捧。或许您之前听说过消费满额即送现金的活动&#xff0c;但循环购模式不仅仅局限于此&#xf…

基于机器学习的网络流量识别分类(完整资源收米)NetFlow-Sentry

项目介绍 这是一个名为NetFlow-Sentry的项目&#xff0c;项目实现了对网络流量的实时检测&#xff0c;特征抓取&#xff0c;内置了基于Pytorch的深度学习模型来进行流量分类。该项目除可以进行实时特征提取&#xff0c;还提供了网络流量数据的输入口&#xff0c;可以直接识别分…

【Arduino】ESP32/ESP8266 JSON格式解析

目录 1、JSON 2、JSON语法格式 基本概念&#xff1a; 语法规则&#xff1a; 数据类型&#xff1a; 示例&#xff1a; 3、JSON解析 单一对象JSON解析&#xff08;无嵌套&#xff09; JSON数组解析 使用ArduinoJson官网在线工具解析JSON信息 ESP8266闪存存储的JSON解析…

MySQL性能优化(提升数据库性能的措施)

万物皆有裂痕&#xff0c;那是光照进来的地方。大家好&#xff0c;今天给大家分享一下关于MySQL性能优化&#xff0c;在处理大型数据集和高负载情况下&#xff0c;MySQL数据库的性能优化是至关重要的。通过合理的调优策略&#xff0c;可以有效提高数据库的响应速度和稳定性。本…

正点原子[第二期]Linux之ARM(MX6U)裸机篇学习笔记-13-按键实验

前言&#xff1a; 本文是根据哔哩哔哩网站上“正点原子[第二期]Linux之ARM&#xff08;MX6U&#xff09;裸机篇”视频的学习笔记&#xff0c;在这里会记录下正点原子 I.MX6ULL 开发板的配套视频教程所作的实验和学习笔记内容。本文大量引用了正点原子教学视频和链接中的内容。…

xhci 寄存器学习

xhci 寄存器介绍 查看linux 代码&#xff1a; 1733 /* There is one xhci_hcd structure per controller */ 1734 struct xhci_hcd { 1735 struct usb_hcd *main_hcd; 1736 struct usb_hcd *shared_hcd; 1737 /* glue to PCI and HCD framework */ 1738 stru…

实操专区-第11周-课堂练习专区-图的标记线和标记点

下载安装ECharts&#xff0c;完成如下样式图形。 代码和截图上传 完成 3.1.3.5 图的标记线和标记点 中的任务点 在一些折线图或柱状图当中&#xff0c;可以经常看到图中对最高值和最低值进行了标记。 在ECharts中&#xff0c;标记点&#xff08;markPoint&#xff09;常用于表示…