100%涨点!2024最新卷积块创新方案盘点(附模块和代码)

在写论文时,设计高效、创新的卷积块可以显著提升模型的性能,保障工作的有效性和先进性。另外,合理利用卷积块还可以帮助我们提升实验结果、拓展研究的视野和应用场景,增加论文的创新点。因此,对于论文er来说,掌握卷积块的设计和应用,对于撰写高质量的学术论文必不可少。

今天学姐就来分享涨点必备的9个卷积块,包含2024年最新,这些卷积块的来源文章以及代码学姐都整理了,还帮同学们罗列了创新点,更详细的工作细节还是建议各位仔细阅读原文。

论文和模块代码需要的同学看文末

1.Efficient Deformable ConvNets: Rethinking Dynamic and Sparse Operator for Vision Applications

涨点神器!DCNv4:新一代高效的可变形卷积

方法:DCNv4是一种高效的动态和稀疏操作符。通过重新思考可变形卷积的动态特性并简化内存访问,DCNv4比其前身DCNv3更快、更有效。DCNv4配备的FlashInternImage骨干网络不仅提高了速度,还改善了各种视觉任务的性能。作者还展示了DCNv4作为通用操作符的多功能性和有效性,将其集成到ConvNeXt和ViT等最先进的架构中,提高了吞吐量和准确性;它在潜在扩散模型中也表现良好,显示出增强生成模型的潜力。

创新点:

  • DCNv4是一种高效的动态和稀疏操作符,通过重新思考可变卷积的动态特性和简化内存访问,比其前身DCNv3更快更有效。

  • DCNv4在FlashInternImage骨干网络中的应用不仅提高了速度,还改善了各种视觉任务的性能。

  • DCNv4通过将其集成到ConvNeXt和ViT等先进架构中,提高了吞吐量和准确性,同时在潜在扩散模型中也表现良好,展示了其增强生成模型的潜力。

2.CoordGate: Efficiently Computing Spatially-Varying Convolutions in Convolutional Neural Networks

CNN涨点神器!CoordGate:计算空间变化卷积

方法:CoordConv在卷积之前将坐标附加到数据上,而CoordGate则通过一个编码器网络将坐标传递,并通过乘法门应用于卷积后的数据,类似于通道注意机制中的门控。这种技术能够根据空间位置选择性地放大或衰减滤波器,并且相比现有的CNNs,它提供了大幅度的效率提升。

创新点:

  • CoordGate是一种新颖的轻量级模块,通过使用乘法门和坐标编码网络,实现了在CNN中高效计算空间变化卷积的功能。

  • CoordGate可以根据空间位置选择性地放大或衰减滤波器,有效地像本地连接的神经网络一样工作。

  • CoordGate在U-Net中的应用表明,它在图像去模糊等各种计算机视觉应用中优于传统方法,提供了更强大和空间感知的解决方案。

3.Run, Don't Walk: Chasing Higher FLOPS for Faster Neural Networks(cvpr2023)

即插即用:部分卷积,减少冗余计算和内存访问,更有效地提取空间特征

方法:论文介绍了PConv和FasterNet这两种快速有效的神经网络模型。PConv是一种设计用于仅对部分输入通道应用常规卷积的方法,而保持其余通道不变。而FasterNet则是基于卷积算子构建的网络模型,其感受野可能有限。论文还提到了这两种模型的一些技术限制,如PConv的部分卷积步长必须为1,以保持卷积输出和未触及通道的空间分辨率一致。

创新点:

  • 作者提出了一种简单而快速有效的算子PConv,可以解决DWConv的内存访问频繁的问题,并且可以轻松地插入到许多现有的网络中。

  • 作者引入了FasterNet,它在GPU、CPU和ARM处理器等各种设备上都能运行得非常快速和普遍。

  • 作者的PConv和FasterNet在速度和准确性方面与现有的算子和网络相比具有竞争力,但仍有一些技术上的限制,可以通过扩大感受野和与其他算子结合来追求更高的准确性。

4.SCConv: Spatial and Channel Reconstruction Convolution for Feature Redundancy

涨点神器!SCConv:即插即用的空间和通道重建卷积

方法:本文研究了深度神经网络中存在的冗余问题,并提出了一种新的CNN压缩方法,称为SCConv(Spatial and Channel reconstruction Convolution),旨在减少参数和计算量而不损失性能。SCConv模块由两个单元组成,即空间重构单元(SRU)和通道重构单元(CRU),可以嵌入到各种架构中。

创新点:

  • 提出了一种通道重构单元,称为CRU,它利用分割-变换-融合策略来减少通道维度中的冗余以及计算成本和存储。

  • 设计了一个两步骤的过程来利用中间特征图的冗余,目的是减少参数和计算量而不损失性能。为此,作者提出了一种新颖的CNN压缩方法,即SCConv(空间和通道重构卷积),它由两个单元组成,即空间重构单元(SRU)和通道重构单元(CRU)。

5.Omni-Dimensional Dynamic Convolution

即插即用的动态卷积ODConv

方法:作者介绍了一种名为Omni-dimensional Dynamic Convolution(ODConv)的新型动态卷积设计,旨在提升深度卷积神经网络(CNN)的表示能力。ODConv利用多维注意机制,在卷积核空间的四个维度上学习四种类型的注意力,并以并行方式逐步应用这些注意力到相应的卷积核上,从而显著增强CNN的基本卷积操作的特征提取能力。

创新点:

  • 作者的首要创新贡献是一种更加通用且优雅的动态卷积设计,称为全维动态卷积(ODConv)。

  • ODConv利用一种多维注意机制,在卷积核空间的四个维度上学习四种类型的注意力,并以并行方式逐渐应用于相应的卷积核,从而大大增强了CNN基本卷积操作的特征提取能力。

  • ODConv即使只使用一个单一的卷积核,也能与现有的具有多个卷积核的动态卷积方法竞争或超越,从而大大减少了额外的参数。

6.KernelWarehouse: Towards Parameter-EffcientDynamic Convolution

让ResNet/MobileNet/ConvNeXt等Backbone一起涨点

方法:本文介绍了KernelWarehouse,一种改进现代ConvNets性能的动态卷积方法。研究结果表明,在KernelWarehouse中增强更多核心单元之间的仓库共享通常会导致更好的性能。

创新点:

  • 不同维度的卷积核之间的仓库共享。作者在主流的卷积神经网络设计中,一个卷积块通常包含多个具有不同维度(k × k × c × f)的卷积核。作者通过对ResNet50骨干网络进行实验,探索了在卷积块中不同维度的卷积核之间进行仓库共享的效果。

  • ConvNeXt-Tiny中KernelWarehouse的设计细节。对于ConvNeXt骨干网络,作者将KernelWarehouse应用于所有的卷积层。在每个阶段中,相应的三个仓库分别共享给逐点卷积层、深度卷积层和下采样层。作者使用最大公约数维度除数作为静态卷积核的统一核单元维度进行核分区。

7.REFCONV: RE-PARAMETERIZED REFOCUSING CONVOLUTION FOR POWERFUL CONVNETS

重参数化重聚焦卷积替代常规卷积,无额外推理成本下涨点明显

方法:论文介绍了一种名为Re-parameterized Refocusing Convolution(RefConv)的重新参数化方法,通过在卷积核参数之间建立额外的连接来增强现有模型结构的先验知识。RefConv作为一种插拔式模块,可以在不改变原始模型结构或引入额外推理成本的情况下显著提高各种CNN在多个任务上的性能。此外,通过展示RefConv减少通道冗余和平滑损失函数的能力,论文解释了RefConv的有效性,这可能会激发进一步的训练动态理论研究。

创新点:

  • 提出了Re-parameterized Refocusing,通过与学习的卷积核建立连接来增强现有结构的先验。因此,重新参数化的卷积核可以学习更多样化的表示,从而进一步提高训练的CNN的表示能力。

  • 证明了RefConv可以减少通道冗余和平滑损失函数,从而解释了其有效性。

8.UniRepLKNet: A Universal Perception Large-Kernel ConvNet for Audio, Video, Point Cloud, Time-Series and Image Recognition

ImageNet88%,顺手统一多模态SOTA大核卷积江湖

方法:本文探讨了大卷积核ConvNet架构,重新思考了传统模型设计中使用深度堆叠小卷积核的方法。通过将3×3卷积添加到小卷积核ConvNet中,我们期望同时产生三个效果:1)扩大感受野,2)增加空间模式的抽象层次(例如从角度和纹理到物体形状),3)通过增加深度改进模型的一般表示能力,引入更多可学习的参数和非线性。

本文还介绍了一种基于块设计的架构指导原则,即使用既能进行通道间通信又能进行空间聚合的高效结构来增加深度。通过在模型中插入一些结构来普遍提升模型的表示能力,包括非线性和高效的可训练变换。

创新点:

  • 作者通过调整深度和宽度来构建UniRepLKNet模型,该模型在速度和准确性方面都表现出色。

  • 经过ImageNet-22K预训练后,UniRepLKNet-S的准确性甚至接近RepLKNet-31L,并且比后者运行速度快3倍。

9.AKConv: Convolutional Kernel with Arbitrary Sampled Shapes andArbitrary Number of Parameters

即插即用的卷积操作来替代常规卷积操作以提高网络性能

方法:本文提出了一种名为AKConv的卷积操作,可以实现任意样本形状和大小的卷积核,从而提供了卷积核选择的多样性。通过在YOLOv5、YOLOv7和YOLOv8等模型上进行目标检测实验,验证了AKConv的优势。

创新点:

  • 为不同大小的卷积核提供了一种生成初始采样坐标的算法。

  • 通过调整不规则卷积核的采样位置,适应目标的不同变化。

  • AKConv设计了多种初始采样形状,可以实现任意采样形状的卷积核操作。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“卷积块”获取论文+模块代码

码字不易,欢迎大家点赞评论收藏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/661447.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

BSV区块链将凭借Teranode的创新在2024年大放异彩

​​发表时间:2024年1月15日 2024年1月15日,瑞士楚格 – BSV区块链协会研发团队今日官宣了Teranode的突破性功能,这些功能将显著提升BSV区块链网络的效率和速度。在不久的将来,BSV区块链的交易处理能力将达到每秒100万笔交易。 T…

粒子群优化算法

PSO算法 粒子群算法(Particle,Swarm Optimization,PSO)由Kennedy和Eberhart于1995年提出,算法模仿鸟群觅食行为对优化问题进行求解。 粒子群算法中每个粒子包含位置和速度两个属性,其中,位置代表了待求问题的一个候选…

安装GPU版本Pytorch(全网最详细过程)

目录 一、前言 二、安装CUDA 三、安装cuDNN 四、安装Anacanda 五、安装pytorch 六、总结 一、前言 最近因为需要安装GPU版本的Pytorch,所以自己在安装过程中也是想着写一篇博客,把整个过程记录下来,在整个过程中也遇到了不少的问题&a…

【开源】基于JAVA+Vue+SpringBoot的用户画像活动推荐系统

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 数据中心模块2.2 兴趣标签模块2.3 活动档案模块2.4 活动报名模块2.5 活动留言模块 三、系统设计3.1 用例设计3.2 业务流程设计3.3 数据流程设计3.4 E-R图设计 四、系统展示五、核心代码5.1 查询兴趣标签5.2 查询活动推荐…

状态压缩 笔记

棋盘式的f[i][j]中表示状态的j可以是状态本身也可以是在合法状态state中的下标 用状态本身比较方便,用下标比较省空间 用下标的话可以开id[M]数组记录一下 蒙德里安的梦想 求把 NM的棋盘分割成若干个 12的长方形,有多少种方案。 例如当 N2&#xff0…

【Redis】一文搞懂redis的所有知识点

目录 1. 什么是Redis?它主要用来什么的? 2.说说Redis的基本数据结构类型 2.1 Redis 的五种基本数据类型​编辑 2.2 Redis 的三种特殊数据类型 3. Redis为什么这么快?​编辑 3.1 基于内存存储实现 3.2 高效的数据结构 3.3 合理的数据编…

新火种AI|哄哄大模型的火爆,给了普通人AI创业破局的关键

作者:一号 编辑:美美 人们似乎更喜欢把AI当做玩具,而非工具。 近日,一款名为哄哄模拟器的AI原生应用火了,一天之内就吸引了60万用户。 哄哄模拟器设置了多种情侣吵架场景,无论你是男是女,都…

光伏设计系统都具备哪些功能?

随着可再生能源的日益重要,光伏能源已成为我们能源结构中的重要组成部分。而光伏设计系统作为实现光伏能源高效利用的关键,其功能也日益丰富和多样化。本文将探讨光伏设计系统所具备的主要功能。 1.数据分析与模拟 光伏设计系统能够对大量的数据进行分…

【经典项目】Java小游戏 —— 贪吃蛇

一、需求分析 当提到贪吃蛇游戏时,通常是指一款经典的电子游戏,玩家通过操作一个蛇在屏幕上移动,目标是吃掉各种食物并尽量避免碰撞到自己的身体或游戏区域的边界。 贪吃蛇游戏最早出现在20世纪70年代末的个人电脑上,后来在各种游…

使用 Paimon + StarRocks 极速批流一体湖仓分析

摘要:本文整理自阿里云智能高级开发工程师王日宇,在 Flink Forward Asia 2023 流式湖仓(二)专场的分享。本篇内容主要分为以下四部分: StarRocksPaimon 湖仓分析的发展历程使用 StarRocksPaimon 进行湖仓分析主要场景和…

ONLYOFFICE是一站式协作免费开源办公神器

一、前言 众所周知,我们工作都离不开办公软件,一个好的办公软件可以大幅度提高工作效率,就目前市场而言,常见的办公软件有微软的 Microsoft Office 以及国产的 WPS Office,微软的 Microsoft Office是付费的&#xff0…

CANoe实际项目中文件夹的规划

本人,之前设计了一个CANoe工程,由于工程设计之初没有设计好文档的归纳分类,导致文件查找起来非常费劲。 为了避免以后出现文件混乱,不可查找的问题,故特此归纳说明。 建立工程时: 第1步就应该设计好文档…

基于51单片机的加油站计费系统

基于51单片机的加油站计费系统[proteus仿真] 计费检测系统这个题目算是课程设计和毕业设计中常见的题目了,本期是一个108基于51单片机的加油站计费系统 需要的源文件和程序的小伙伴可以关注公众号【阿目分享嵌入式】,赞赏任意文章 2¥&#…

“软件老兵”的新征程:从代码到方案,40岁转身更显智慧锋芒

在快速迭代的软件行业,许多经验丰富的软件工程师,随着年岁的增长,发现自己在纯技术领域的竞争力似乎逐渐不敌那些刚刚踏入职场的00后工程师。 面对这一挑战,一些“软件老兵”选择转换跑道,将目光投向了方案工程师这一新…

Linux同时安装多个版本的JDKlinux多版本JDK切换配置- [Centos 安装JDK]

Linux同时安装多个版本的JDK&linux多版本JDK切换配置- [Centos 安装JDK] 一、查询系统是否已经安装jdk rpm -qa|grep java 或 rpm -qa|grep jdk 或 rpm -qa|grep gcj 二、卸载已安装的jdk Centos7存在已安装的JDK1.7时,可以使用以下方式删除1.7的openJDK rp…

python数据类型-元组

1 元组(tuple)的定义 元组是集合类型,和列表类似,元组中的元组类型可以不同,元素间用逗号隔开,和列表的不同之处在于: 1 元组的元组不可改变,也被称为只读列表 2 且元组用括号()表示,列表用方括…

月入过万比打工强,在家就能做steam搬砖项目真的假的

每天都有粉丝私下跟我聊天,讨论Steam搬砖项目到底是不是真的,到底能不能做。你想让我详细说说。那么今天就和大家详细聊聊这个月入过万元的项目。 简单来说,Steam搬砖项目就是在国外蒸汽上采购游戏道具,在国内网易buff平台上销售…

MySQL 可重复读隔离级别,完全解决幻读了吗?

文章目录 前言一、什么是幻读?二、快照读是如何避免幻读的?三、当前读是如何避免幻读的?四、幻读被完全解决了吗?场景1场景2 总结 前言 MySQL InnoDB 引擎的默认隔离级别虽然是「可重复读」,但是它很大程度上避免幻读…

第 10 章:在C++中使用协程进行系统编程

最后一章专门介绍了一项对系统编程非常有用的功能,但这在C标准中相对较新。协程对象迅速找到了应用,成为了一等公民的状态机对象。它们的强大之处在于隐藏了协程帧后面的逻辑。请注意,这是一个高级主题,且C的协程接口既不简单也不…

交叉注意力融合2024创新方案汇总,附配套模块和代码

多模态学习和注意力机制是当前深度学习研究的热点领域之一,而交叉注意力融合作为这两个领域的结合点,具有很大的发展空间和创新机会。 作为多模态融合的一个重要组成部分,交叉注意力融合通过注意力机制在不同模块之间建立联系,促…