【DeepLearning-9】YOLOv5模型网络结构中加入MobileViT模块

一、神经网络的前中后期

在神经网络中,特别是在深度卷积神经网络(CNN)中,“网络早期(低层)”、“网络中期(中层)”和“网络后期(高层)”通常指的是网络结构中不同层级的部分,每个部分在特征提取和信息处理方面有其特定的作用和特性。

1. 网络早期(低层)

  • 在网络的早期阶段插入 MobileViTBv3 可能会对原始图像进行较深层次的处理,有助于捕捉更丰富的空间特征。但同时,Transformer可能无法充分利用其处理高级语义特征的能力。

2. 网络中期(中层)

  • 在网络的中间层插入 MobileViTBv3 可能是一个平衡点,可以在提取一定级别的特征后利用Transformer的长程依赖捕捉能力。

3. 网络后期(高层)

  • 在网络的后期阶段插入 MobileViTBv3 会使其处理更抽象的特征,有助于捕捉复杂的上下文信息,但可能会丢失一些细节信息。

二、插入 MobileViTBv3 模块

在YOLOv5配置中插入 MobileViTBv3 模块需要考虑到模块的功能和网络的整体架构。MobileViTBv3 结合了卷积神经网络(CNN)和Transformer的特点,适合于复杂特征的提取和长程依赖的捕捉。基于这些考虑,以下是几个较为合适的的插入位置:

  1. 主干网络中的中期阶段

    • 例如,在 [-1, 1, Conv, [256, 3, 2]][-1, 6, C3, [256]] 之间。
    • 这里,MobileViTBv3 可以处理相对抽象的特征,并利用其Transformer部分捕捉更复杂的依赖关系。
  2. 主干网络后期

    • 在更深的层次,例如在 [-1, 1, Conv, [512, 3, 2]][-1, 9, C3, [512]] 之间。
    • 在这个位置,MobileViTBv3 将处理高级特征,并可能更好地利用Transformer结构处理复杂的场景。
  3. 检测头前期

    • 在检测头的初始阶段,例如在 [[17, 20, 23], 1, Detect, [nc, anchors]] 之前。
    • 这可以使 MobileViTBv3 直接对用于检测的特征进行最后的优化。

 三、各类型YOLOv5模型的前中后期划分

 以yolov5l.yaml为例

网络前期(低层)
  • 定位:主干网络(backbone)的开始部分。
  • 包含的层
    • [-1, 1, Conv, [64, 6, 2, 2]] # 0-P1/2
    • [-1, 1, Conv, [128, 3, 2]] # 1-P2/4
  • 作用:这些层主要负责捕获基础视觉特征,如边缘、纹理等。特征相对简单,更多关注细节。
网络中期(中层)
  • 定位:主干网络中的中间部分。
  • 包含的层
    • [-1, 3, C3, [128]]
    • [-1, 1, Conv, [256, 3, 2]] # 3-P3/8
    • [-1, 6, C3, [256]]
  • 作用:这些层处理更复杂的特征,例如特定的形状和模式。开始从细节特征过渡到更抽象的特征表示。
网络后期(高层)
  • 定位:主干网络的末尾以及检测头(head)。
  • 包含的层
    • [-1, 1, Conv, [512, 3, 2]] # 5-P4/16
    • [-1, 9, C3, [512]]
    • [-1, 1, Conv, [1024, 3, 2]] # 7-P5/32
    • [-1, 3, C3, [1024]]
    • [-1, 1, SPPF, [1024, 5]] # 9
    • 检测头(head)中的所有层
  • 作用:这些层负责处理高级别的特征,通常与目标检测任务直接相关。在这里,特征更加抽象,与目标的类别、位置等信息密切相关。

代码实现 MobileViTBv3 模块插入:

# YOLOv5 🚀 by Ultralytics, AGPL-3.0 license# Parameters
nc: 80  # number of classes
depth_multiple: 1.0  # model depth multiple
width_multiple: 1.0  # layer channel multiple
anchors:- [10,13, 16,30, 33,23]  # P3/8- [30,61, 62,45, 59,119]  # P4/16- [116,90, 156,198, 373,326]  # P5/32# YOLOv5 v6.0 backbone
backbone:# [from, number, module, args][[-1, 1, Conv, [64, 6, 2, 2]],  # 0-P1/2[-1, 1, Conv, [128, 3, 2]],  # 1-P2/4[-1, 3, C3, [128]],[-1, 1, Conv, [256, 3, 2]],  # 3-P3/8[-1, 6, MobileViTBv3, [256]],[-1, 6, C3, [256]],[-1, 1, Conv, [512, 3, 2]],  # 5-P4/16[-1, 6, MobileViTBv3, [256]],[-1, 9, C3, [512]],[-1, 1, Conv, [1024, 3, 2]],  # 7-P5/32[-1, 3, C3, [1024]],[-1, 1, SPPF, [1024, 5]],  # 9]# YOLOv5 v6.0 head
head:[[-1, 1, Conv, [512, 1, 1]],[-1, 1, nn.Upsample, [None, 2, 'nearest']],[[-1, 6], 1, Concat, [1]],  # cat backbone P4[-1, 3, C3, [512, False]],  # 13[-1, 1, Conv, [256, 1, 1]],[-1, 1, nn.Upsample, [None, 2, 'nearest']],[[-1, 4], 1, Concat, [1]],  # cat backbone P3[-1, 3, C3, [256, False]],  # 17 (P3/8-small)[-1, 1, Conv, [256, 3, 2]],[[-1, 14], 1, Concat, [1]],  # cat head P4[-1, 3, C3, [512, False]],  # 20 (P4/16-medium)[-1, 3, MobileViTBv3, [512, False]],[-1, 1, Conv, [512, 3, 2]],[[-1, 10], 1, Concat, [1]],  # cat head P5 [-1, 3, C3, [1024, False]],  # 23 (P5/32-large)[[17, 20, 23], 1, Detect, [nc, anchors]],  # Detect(P3, P4, P5)]

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/651552.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【云原生】初识Docker,安装以及了解操作命令

一、为什么要使用容器? 背景:以前开发、测试、生产为不同的环境,痛点是发现开发测试以后没问题,但是在生产环境无法运行。给测试、开发、运维人员造成了大量的工作。最终结果是发版更新速度也跟不上,效率低 我认为使…

JAVA 学习 面试(十)枚举、注解、基本原则

枚举 默认继承 java.lang.Enum 类,不能继承其他父类,并自动添加了values(获取枚举类中的所有枚举值)和valueOf(获取对应的枚举类型)方法, java.lang.Enum 类实现了 java.lang.Serializable 和 …

翻译: GPT-4 with Vision 升级 Streamlit 应用程序的 7 种方式二

GPT-4 Vision 系列: 翻译: GPT-4 with Vision 升级 Streamlit 应用程序的 7 种方式一 GPT-4 Vision 的 7 个实际用例 Pre-requisites:先决条件: 订阅 ChatGPT Plus 以访问 GPT-4 Vision。如果您不熟悉 Streamlit,请按照安装步骤操作。 1. 绘制您的应…

C++面试:二叉树和红黑树

目录 二叉树 1. 二叉树的定义 2. 二叉树的遍历 3. 二叉树的应用 4. 实现细节 5. C中的实现 面试准备 红黑树 红黑树的原理 红黑树的用途 示例代码 面试准备 1. 红黑树的工作原理及其规则 2. 红黑树的优势及与其他二叉搜索树(如AVL树)的比较…

尚无忧球馆助教系统源码,助教小程序源码,助教源码,陪练系统源码

特色功能: 不同助教服务类型选择 助教申请,接单,陪练师入住,赚取外快 线下场馆入住 设置自己服务 城市代理 分销商入住 优惠券 技术栈:前端uniapp后端thinkphp 独立全开源

.NET高级面试指南专题一【委托和事件】

在C#中,委托(Delegate)和事件(Event)是两个重要的概念,它们通常用于实现事件驱动编程和回调机制。 委托定义: 委托是一个类,它定义了方法的类型,使得可以将方法当作另一个…

pyqt添加菜单栏

参考: https://blog.csdn.net/seniorwizard/article/details/109820641 import sys from PyQt5 import QtCore, QtGui, QtWidgets from PyQt5.QtCore import Qt from PyQt5.QtWidgets import (QApplication, QMainWindow, QMenuBar, QMenu, QAction, QPlainTextEdi…

HarmonyOS鸿蒙ArkTS,封装http网络请求

HarmonyOS鸿蒙ArkTS,封装http网络请求 前提: 要想使用http请求,系统必须要具备ohos.permission.INTERNET权限,在model.json5文件中的module模块下添加如下请求权限: 在module.json5文件中 配置 "requestPermi…

踩坑(6)Redisson调用unlockAsync方法释放锁失败

问题描述 通过redisson的lockAsync异步方法获取到锁之后&#xff0c;再业务执行完成后调用lock.unlockAsync()无法释放当前锁&#xff0c;导致后续的方法被阻塞 public void asyncLock() {RLock lock redissonClient.getLock("asyncLock");RFuture<Void> fut…

LeetCode 热题 100 | 矩阵

目录 1 73. 矩阵置零 2 54. 螺旋矩阵 3 48. 旋转图像 4 240. 搜索二维矩阵 II 菜鸟做题第二周&#xff0c;语言是 C 1 73. 矩阵置零 解题思路&#xff1a; 遍历矩阵&#xff0c;寻找等于 0 的元素&#xff0c;记录对应的行和列将被记录的行的元素全部置 0将被记录的…

k8s 进阶实战笔记 | Scheduler 调度策略总结

文章目录 Scheduler 调度策略总结调度原理和过程调度策略nodeSelect亲和性和反亲和性NodeAffinify亲和验证PodAffinity 亲和验证PodAntiAffinity 反亲和验证污点与容忍跳过 Scheduler 调度策略 调度策略场景总结 Scheduler 调度策略总结 调度原理和过程 Scheduler 一直监听着…

k8s Ingress部署应用

Deployment(部署) Deployment处于master节点&#xff0c;master会选择合适的work节点创建Container Container会被包含在Pod中 通过k8s部署一个nginx kubectl create deployment my-nginx --imagenginx创建一个tomcat 镜像 创建一个tomcat-svc.yaml文件 创建service类型…

【心得】java JNDI配合RMI实现注入个人笔记

目录 JNDI RMI 基本概念 RMI 基本逻辑 恶意利用 JNDI注入RMI实现攻击 JNDI Java Naming and Directory Interface Java 命令和目录接口 让配置参数 和 代码 解耦的规范或者思想 低耦合 高内聚 Name 命名 java对象 通过 命名 绑定到 容器环境 java对象和一个特定的…

Java技术栈 —— Kafka入门(一)

Java技术栈 —— Kafka入门&#xff08;一&#xff09; 一、什么是Kafka&#xff1f;二、如何安装Kafka&#xff1f; 一、什么是Kafka&#xff1f; Kafka是一种消息队列&#xff0c;通过订阅-发布机制可以实现解耦合&#xff0c;用异步处理代替同步处理[1] 。&#xff08;理解这…

REVIT二次开发万能刷

将这两个参数赋予其他参数 步骤2 将来做个可以调控的版本 using System; using System.Collections.Generic; using System.Lin

如何把word檔案自動化

1.安裝 pip install jojo-office ( 安裝這個) 2.讀取表格內容與文章內容&#xff0c;範例如下 import office from docx import Document replace{“{user_name}”:“陳彥甫”, “{tele}”:“0912882881”} docDocument(“template.docx”) tabledoc.tables[0] print(“ii:”…

《Python 简易速速上手小册》第7章:高级 Python 编程(基于最新版 Python3.12 编写)

注意&#xff1a;本《Python 简易速速上手小册》 核心目的在于让零基础新手「快速构建 Python 知识体系」 文章目录 <mark >注意&#xff1a;本《Python 简易速速上手小册》<mark >核心目的在于让零基础新手「快速构建 Python 知识体系」 7.1 装饰器和闭包7.1.1 装…

华为机考入门python3--(4)牛客4-字符串分隔

分类&#xff1a;字符串 知识点&#xff1a; 复制符号* 复制3个0 0*3 000 字符串截取 截取第i位到j-1位 str[i:j] 题目来自【牛客】 input_str input().strip()# 先补齐 if len(input_str) % 8 ! 0: input_str 0 * (8 - len(input_str) % 8) # 每8个分 out…

R语言【taxlist】——indended_list():将层级结构输出为缩进列表

Package taxlist version 0.2.4 Description 将 taxlist 对象打印分类层次结构&#xff08;等级和父子关系&#xff09;输出为缩进列表。 Usage indented_list(object, ...)## S4 method for signature taxlist indented_list(object,filter,keep_children TRUE,keep_parent…

uniapp微信小程序-请求二次封装(直接可用)

一、请求封装优点 代码重用性&#xff1a;通过封装请求&#xff0c;你可以在整个项目中重用相同的请求逻辑。这样一来&#xff0c;如果 API 发生变化或者需要进行优化&#xff0c;你只需在一个地方修改代码&#xff0c;而不是在每个使用这个请求的地方都进行修改。 可维护性&a…