💡本篇内容
:YOLOv10改进RepVB:最新重参数化结构 顶会2023 二次改进升级版 最新开源移动端网络架构,速度贼快
💡🚀🚀🚀本博客 改进源代码改进 适用于 YOLOv10 按步骤操作运行改进后的代码即可
💡只需订阅这一个专栏即可阅读:芒果YOLOv10所有改进内容
💡本文提出改进 原创
方式:二次创新,YOLOv10专属
论文理论部分 + 原创最新改进 YOLOv10 代码实践改进
文章目录
- 论文理论部分 + 原创最新改进 YOLOv10 代码实践改进
- 论文贡献
- 论文细节
- 二、结合 YOLOv10原创改进 RepVB重参数化结构
- 2.1 网络配置
- 2.1 网络配置
- 3.2 核心代码
- 修改部分
- 3.3 运行代码
最近,与资源受限的移动设备上的轻量级卷积神经网络 (CNN) 相比,轻量级视觉变换器 (ViT) 表现出了卓越的性能和更低的延迟。这种改进通常归功于多头自注意力模块,它使模型能够学习全局表示。然而,轻量级 ViT 和轻量级 CNN 之间的架构差异尚未得到充分研究。在这项研究中,我们重新审视了轻量级 CNN 的高效设计,并强调了它们在移动设备上的潜力。我们通过集成轻量级 ViT 的高效架构选择,逐步增强标准轻量级 CNN(特别是 MobileNetV3)的移动友好性。最终产生了一个新的纯轻量级 CNN 系列,即 RepViT。大量实验表明,RepViT 的性能优于现有最先进的轻量级 ViT,并在各种视觉任务中表现出良好的延迟。在 ImageNet 上,RepViT 在 iPhone 12 上实现了超过 80% 的 top-1 准确率和近 1ms 的延迟,据我们所知,这对于轻量级模型来说还是第一次。我们最大的模型 RepViT-M3 获得