【YOLO改进】换遍MMDET主干网络之EfficientNet(基于MMYOLO)

EfficientNet

EfficientNet是Google在2019年提出的一种新型卷积神经网络架构,其设计初衷是在保证模型性能的同时,尽可能地降低模型的复杂性和计算需求。EfficientNet的核心思想是通过均衡地调整网络的深度(层数)、宽度(每层的通道数)和分辨率(输入的图像尺寸)这三个维度,以实现模型的性能最大化。

具体来说,EfficientNet使用了一个复合缩放方法(compound scaling method),该方法将深度、宽度和分辨率的缩放比例视为一个整体进行考虑,而不是分别进行缩放。通过这种方式,EfficientNet可以在保证模型性能的同时,实现参数数量的减少和计算效率的提高。

EfficientNet包括多个变体,从EfficientNet-B0到EfficientNet-B7,其中“B”后面的数字越大,网络的深度和宽度越大,需要的计算资源也越多,但同时能够达到更高的性能。

EfficientNet作为YOLO主干网络的可行性分析

  1. 性能优势:EfficientNet作为一种高效的卷积神经网络架构,具有出色的性能表现。将其作为YOLO的主干网络,可以充分利用其高效的特征提取能力,从而提高目标检测的精度和效率。特别是EfficientNet的复合缩放方法,可以在不增加过多计算量的前提下,进一步提高模型的性能。
  2. 兼容性:YOLO是一种基于卷积神经网络的目标检测算法,而EfficientNet同样是一种基于卷积神经网络的模型。因此,EfficientNet作为YOLO的主干网络具有很好的兼容性。通过合理的网络结构和参数设置,可以将EfficientNet与YOLO的检测头进行有效地融合,形成完整的目标检测模型。
  3. 优化与改进:虽然EfficientNet已经具有很好的性能表现,但在实际应用中还可以根据具体任务需求进行进一步的优化和改进。例如,可以通过调整EfficientNet的网络结构、深度、宽度等参数来平衡模型的性能和速度;也可以采用一些先进的优化技术(如剪枝、量化等)来减小模型的参数量和计算量,进一步提高模型的实时性和部署能力。

替换EfficientNet(基于MMYOLO)

OpenMMLab 2.0 体系中 MMYOLO、MMDetection、MMClassification、MMSelfsup 中的模型注册表都继承自 MMEngine 中的根注册表,允许这些 OpenMMLab 开源库直接使用彼此已经实现的模块。 因此用户可以在 MMYOLO 中使用来自 MMDetection、MMClassification、MMSelfsup 的主干网络,而无需重新实现。

假设想将'EfficientNet'作为 'yolov5' 的主干网络,则配置文件如下:

_base_ = './yolov5_s-v61_syncbn_8xb16-300e_coco.py'deepen_factor = _base_.deepen_factor
widen_factor = 1.0
channels = [48, 136, 384]
checkpoint_file = 'https://download.openmmlab.com/mmclassification/v0/efficientnet/efficientnet-b3_3rdparty_8xb32-aa_in1k_20220119-5b4887a0.pth'  #model = dict(backbone=dict(_delete_=True,type='mmdet.EfficientNet',arch='b3',drop_path_rate=0.2,out_indices=(3, 4, 5),frozen_stages=0,norm_cfg=dict(type='SyncBN', requires_grad=True, eps=1e-3, momentum=0.01),norm_eval=False,init_cfg=dict(type='Pretrained', prefix='backbone', checkpoint=checkpoint_file)),neck=dict(type='YOLOv5PAFPN',deepen_factor=deepen_factor,widen_factor=widen_factor,in_channels=channels, # 注意:EfficientNet 输出的3个通道是 [48, 136, 384],和原先的 yolov5-s neck 不匹配,需要更改out_channels=channels),bbox_head=dict(type='YOLOv5Head',head_module=dict(type='YOLOv5HeadModule',in_channels=channels, # head 部分输入通道也要做相应更改widen_factor=widen_factor))
)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/11078.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

深入解析MySQL中的事务(下)

MySQL事务管理 3. 隔离性(Isolation)查看和设置隔离级别隔离级别作用域区别与解析 四种隔离级别解析小结 4. 一致性(Consistency)如何保持一致性 5.“保持原子性、隔离性、持久性就能保证一致性”的理解: 四、如何理解…

【高阶数据结构】并查集

并查集 并查集1、概念2、根据人找编号 / 根据编号找人(简单介绍一下并查集)(1)代码展示(2)调试结果(3)优化1:小的往大的合并(4)优化2:…

Linux下安装gmp6.2.1的详细操作(深度学习)

方式一:编译gmp GMP官方地址https://gmplib.org/ 1. 官网下载gmp安装包 2. 解压下载好的安装包 tar -zxvf gmp-6.2.1.tar.bz2 3. 进入解压后的文件夹 cd gmp-6.2.1 4. 指定安装路径进行安装 # /usr/local换成自己的安装路径 ./configure --prefix/usr/local 5. 编…

鸿蒙ArkUI-X跨平台开发电商应用

一、ArkUI-X 简介 ArkUI-X 是由 OpenHarmony TSC - 跨平台应用开发框架 TSG 所孵化的开源项目,使用ArkUI-X可以让开发者基于一套主代码, 就可以构建支持多平台的精美、高性能应用。目前支持OpenHarmony、HarmonyOS、Android、 iOS,后续会逐步增加更多平台支持。 ArKUI跨平台…

volatile 和 synchronzied 的区别

文章目录 概述volatilesynchornizedvolatile vs synchornized总结 概述 提起并发编程,我们不得不说起 volatile 和 synchronized 这两个关键字,这两个关键字也是面试中常常被问到的,下面我们分别介绍一下这两个关键字以及二者的异同。首先需要…

3099.哈沙德数——力扣

3099. 哈沙德数 已解答 简单 相关标签 相关企业 提示 如果一个整数能够被其各个数位上的数字之和整除,则称之为 哈沙德数(Harshad number)。给你一个整数 x 。如果 x 是 哈沙德数 ,则返回 x 各个数位上的数字之和&#xff0…

Java构造方法详解

在Java方法内部定义一个局部变量时,必须要初始化,否则就会编译失败,如下: 要让上述代码通过编译,只需在使用a之前给a赋一个初始值即可 如果是对象:下面用一个日期类演示 我们没有给年月日赋值,…

RIP、OSPF、BGP等协议及华为路由器配置总结

直连路由:无需配置,当接口存在IP且状态正常时,路由器会自动生成直连网段的路由表。(*可以配置自身作为下一跳) 对于不直连的网段,需要静态路由(手动配置、适合简单拓扑)或动态路由&…

[通用人工智能] 论文分享:ElasticViT:基于冲突感知超网的快速视觉Transformer

引言: 近年来,视觉Transformer(Vision Transformer,简称ViT)在计算机视觉任务中的应用日益广泛,从图像分类到对象识别等,均显示出优越的性能。然而,ViT模型也面临一些挑战,特别是在模…

ASME美国机械工程师学会文献如何查询下载经验分享

一、ASME美国机械工程师学会数据库简介: ASME是世界上最大的技术出版机构之一,制定众多的工业和制造业行业标准。现在ASME拥有工业和制造行业的600项标准和规范,这些标准在全球90多个国家被采用。 ASME数据库包含25种专业期刊,其…

Java数据结构(链表实战一)

前言 基于链表的操作比较多,希望通过一系列的实战操作,加深对链表的理解和应用。每日更新两题,希望学习的小伙伴关注一波,评论区欢迎讨论交流。 今日份练习 打印两个有序链表的公共部分 实现原理 既然是有序链表,…

鸿蒙内核源码分析(共享内存) | 进程间最快通讯方式

运行机制 共享好端端的一词,近些年被玩坏了,共享单车,共享充电宝,共享办公室,共享雨伞… 甚至还有共享女朋友,真是人有多大胆,共享有多大产。但凡事太尽就容易恶心到人,自己也一度被 共享内存 恶心到了&am…

OpenHarmony 实战开发——轻量带屏解决方案之恒玄芯片移植案例

本文章基于恒玄科技BES2600W芯片的欧智通 Multi-modal V200Z-R开发板 ,进行轻量带屏开发板的标准移植,开发了智能开关面板样例,同时实现了ace_engine_lite、arkui_ui_lite、aafwk_lite、appexecfwk_lite、HDF等部件基于OpenHarmony LiteOS-M内…

论文AI率:检测原理是什么?该如何降低论文AI率?

我是娜姐 迪娜学姐 ,一个SCI医学期刊编辑,探索用AI工具提效论文写作和发表。 上一篇介绍了10个检测AI率的在线工具。本篇来说说AI率到底是如何检测出来的?该如何有效降低论文的AI率? 和AI大模型一样,AI检测的核心也是…

软件设计师考试---一系列

直接内存存取 直接内存存取(Direct Memory Access,简称DMA)是计算机处理器中的一种特性,它允许外部存储器(例如硬盘或网络适配器)在不需要中央处理器的干预下直接访问计算机的内存空间。这种机制显著加快了…

vscode打开esp-idf工程,找不到头文件,有波浪线

就像这样 多半是因为原始的工程不是用vscode的插件新建的,因此没有相关的路径。需要在工程文件夹下的.vscode文件夹中的c_cpp_properties.json文件中增加路径,可以参考插件自动新建的工程里面的写法 {"configurations": [{"name":…

布隆过滤器详解

什么是布隆过滤器 布隆过滤器(Bloom Filter)是一种空间效率极高的概率型数据结构,由伯顿布隆(Burton Howard Bloom)在1970年提出。它主要用于测试一个元素是否属于某个集合,尽管存在一定的误报率&#xff0…

线上问题——一次几经反转惊心动魄的问题排查记录

背景简述 线上某业务由于查询大量数据频繁FullGc优化,依赖于用户完课进度,测试时需要造大量的用户和专栏内容发放数据,且需要用户完课触发,因此在FAT造了一个5000人的班级,这个班级只有3个课时,测试通过脚…

RTEMS RPi4B BSP 添加system timer驱动支持

RPi4 有两种timer,ARM timer 和 system timer。 The ARM Timer is based on a ARM SP804, but it has a number of differences with the standard SP804. The clock from the ARM timer is derived from the system clock. This clock can change dynamically e.…

回溯算法1

回溯函数又称为递归函数,是纯暴力搜索。 回溯算法可以解决 组合问题,切割问题,子集问题,排列问题,棋盘问题(n皇后)。 在解决这些问题的时候可以使用n循环,但是十分困难&#xff0c…