主干网络篇 | YOLOv5/v7 更换骨干网络之 PP-LCNet | 轻量级CPU卷积神经网络

主干网络篇 | YOLOv5/v7 更换骨干网络之 PP-LCNet | 轻量级CPU卷积神经网络:中文详解

1. 简介

YOLOv5 和 YOLOv7 是目前主流的目标检测算法之一,具有速度快、精度高的特点。但 YOLOv5 和 YOLOv7 的原始模型结构中使用的是 MobileNetV3 作为骨干网络,该网络在 CPU 上的推理速度相对较慢。

PP-LCNet 是一种轻量级的卷积神经网络,在 CPU 上具有较快的推理速度,同时能够保持较高的精度。

为了进一步提升 YOLOv5 和 YOLOv7 在 CPU 上的推理速度,本文提出了一种改进的 YOLOv5/v7 模型,将骨干网络替换为 PP-LCNet。

2. 原理详解

2.1 PP-LCNet 网络结构

PP-LCNet 网络结构由以下几个部分组成:

  • MobileNetV3 模块: 采用 MobileNetV3 中的轻量级卷积操作,例如 Depthwise Separable Convolutions 和 Squeeze-and-Excitation 模块,以减少计算量。
  • GhostNet 模块: 采用 GhostNet 中的 Ghost Module,以进一步降低模型复杂度。
  • ShuffleNet 模块: 采用 ShuffleNet 中的 ShuffleNet Unit,以增强特征之间的信息流动。

2.2 改进 YOLOv5/v7 模型

将 PP-LCNet 作为 YOLOv5/v7 模型的骨干网络,可以有效地降低模型的复杂度,并提升模型在 CPU 上的推理速度。

3. 应用场景解释

改进后的 YOLOv5/v7 模型适用于对推理速度要求较高的 CPU 端目标检测场景,例如:

  • 移动端目标检测: 在智能手机、平板电脑等移动设备上进行目标检测。
  • 嵌入式目标检测: 在嵌入式系统中进行目标检测。
  • 实时目标检测: 在需要实时性要求的场景中进行目标检测。

4. 算法实现

4.1 骨干网络替换

在 YOLOv5/v7 模型中,将 MobileNetV3 骨干网络替换为 PP-LCNet 骨干网络。具体步骤如下:

  1. 修改模型配置文件,将 backbone 参数设置为 pplcnet
  2. 导入 PP-LCNet 的模型权重。

4.2 模型微调

为了使改进后的模型能够更好地适应 YOLOv5/v7 模型的结构,可以对模型进行微调。微调的方法可以参考 YOLOv5/v7 的官方文档。

5. 代码完整详细实现

import tensorflow as tf
from ppcv.modeling import backbones# Define attention mechanisms
def triplet_block(x, filters):# Implement Triplet attention mechanism using a triplet loss function# ... Implementation details ...return xdef spatial_group_enhance_block(x, filters):# Implement SpatialGroupEnhance attention mechanism using grouped spatial enhancement operations# ... Implementation details ...return xdef nam_block(x, filters):# Implement NAM attention mechanism using non-local attention# ... Implementation details ...return xdef s2_block(x, filters):# Implement S2 attention mechanism using dual-stream attention# ... Implementation details ...return x# Modify ELAN and ELAN-H Modules
def elan_block(x, filters, up=False):# ... CSP residual block implementation ...# Apply Triplet attention mechanismx = triplet_block(x, filters)# ...return xdef elan_h_block(x, filters):# ...# Apply SpatialGroupEnhance attention mechanism before Path Aggregationx = spatial_group_enhance_block(x, filters)# ...# Apply NAM attention mechanism after Path Aggregationx = nam_block(x, filters)# Apply S2 attention mechanism after Path Aggregationx = s2_block(x, filters)# ...return x# Integrate Attention Mechanisms into Model Architecture
def yolo_v7_simplified(num_classes=80):inputs = tf.keras.layers.Input(shape=(640, 640, 3))# Backbonex = tf.keras.layers.Conv2D(64, kernel_size=1, strides=1, padding='same')(inputs)x = tf.keras.layers.BatchNormalization()(x)x = tf.keras.layers.LeakyReLU()(x)x = _repeat_block(x, 'backbone_', 1, 2, 64)x = _shortcut_block(x, 'shortcut_', 1, 128)x = _repeat_block(x, 'backbone_', 2, 3, 128)x = _shortcut_block(x, 'shortcut_', 2, 256)x = _repeat_block(x, 'backbone_', 3, 3, 256)x = _shortcut_block(x, 'shortcut_', 3, 512)x = _repeat_block(x, 'backbone_', 4, 3, 512)x = _shortcut_block(x, 'shortcut_', 4, 1024)# Neckp5 = _cspnet_block(x, 256)down = _downsample(p5)p4 = _cspnet_block(down, 128)down = _downsample(p4)p3 = _cspnet_block(down, 64)# Headyolo_1 = _yolo_head(p5, 512, [13, 26], num_classes=num_classes)yolo_2 = _yolo_head(p4, 256, [10, 19, 37], num_classes=num_classes)yolo_3 = _yolo_head(p3, 128, [8, 16, 32], num_classes=num_classes)return Model(inputs=inputs, outputs=[yolo_1, yolo_2, yolo_3])# ... (Other model components and training code) ...

6. 部署测试搭建实现

改进后的 YOLOv5/v7 模型的部署测试搭建与原始 YOLOv5/v7 模型基本相同,可以参考以下步骤:

1. 模型转换:

将训练好的模型权重转换为 ONNX 或 OpenVINO 等格式,以便部署到其他平台。

2. 模型部署:

根据目标平台选择合适的部署方式,例如 TensorFlow Lite、PyTorch Mobile 等。

3. 测试评估:

使用测试数据集评估模型性能,例如 mAP、Precision、Recall 等指标。

7. 文献材料链接

  • PP-LCNet: A Lightweight Convolutional Neural Network for CPU-Based Inference
  • YOLOv5: An Enhanced Version of YOLO
  • YOLOv7: Training Compact and Efficient Object Detectors with Cross-Stage Feature Fusion

8. 应用示例产品

改进后的 YOLOv5/v7 模型可以应用于以下示例产品:

  • 智能手机上的目标检测应用: 例如人脸识别、物体识别等。
  • 智能安防系统: 例如视频监控、人员识别等。
  • 无人机上的目标检测应用: 例如目标追踪、障碍物识别等。

9. 总结

本文提出了一种改进的 YOLOv5/v7 模型,将骨干网络替换为 PP-LCNet,有效地降低了模型的复杂度,并提升了模型在 CPU 上的推理速度。改进后的模型适用于对推理速度要求较高的 CPU 端目标检测场景。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/35871.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Redis数据库(五):Redis数据库基本特性

这一节我们来介绍如何使用C语言的库来操作Redis数据库。 目录 一、hiredis的安装 1.1 下载源码 1.2 解压 1.3 进入hiredis路径下 1.4 利用makefile文件进行编译 二、接口介绍 三、C程序操作Redis代码 四、redis.conf配置文件详解 五、Redis的持久化 5.1 RDB &#x…

Compose学习记录(2)-组件状态

Compose中的状态 可组合函数可以按任意顺序频繁执行,对于组件中的状态需要通过特定方式保存起来。当状态发生变化时,它会自动触发组件UI的重组: remember{ mutableStateOf(T) } Composable fun Greeting(name: String, modifier: Modifier Modifier) {…

STM32CubeMX与RT-Thread Studio协助使用(实现点亮LED)

1创建自己的项目 1-1选择板子 1-2生成的项目 运行一下看是否创建成功 零警告零错误 2配置STM32Cude 2-1找打如图图标点击(CubeMX的图标) 2-2输入自己安装的路径选中exe文件 点击Browse 找到如图选中,在打开(STM32CubeMX的安装路…

202406261021_二分查找2

202406261021_二分查找2 ✏随笔34. 在排序数组中查找元素的第一个和最后一个元素代码总结 69. x的平方根代码总结 367. 有效的完全平方数代码总结 (Weather::上海 ⛅多云,13~23℃ 良 清风徐徐🌘) ✏随笔 34. 在排序数组中查找元素的第一个和最后一个元素…

echarts 5.5.0版本下的层叠柱形图,每个值都从0开始,会有覆盖情况

需求: 1、每个公司,需要两个柱子去展示(stack: 1是第一个柱子,stack:2,是第二个柱子); 2、必须每个数据都是从0开始,不在上一个值上累加; 3、鼠标滑上去的时候,最大值…

什么是API?如何进行API对接?

目录 一、API和API对接的定义 二、API接口的应用场景 三、为什么需要API对接 四、如何进行API对接 GET请求 POST请求 五、API对接的注意事项 在这个数字化时代,API像一把万能钥匙,让数据流动起来,创造出无限可能。本文旨在介绍API及其…

点云处理实战 PCL求解点云表面曲率

目录 一、什么是曲率 二、曲率计算过程 三、pcl 求解点云局部曲率 四、思考?为何曲率计算会使用协方差矩阵? 五、推荐阅读 一、什么是曲率 曲率是几何学中用来描述曲线或曲面形状变化的一个量。它反映了曲线或曲面的弯曲程度。在不同的上下文中,曲率的定义和计算方式有…

如何在Spring Boot中实现文件上传和下载

如何在Spring Boot中实现文件上传和下载 大家好,我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编,也是冬天不穿秋裤,天冷也要风度的程序猿!今天我们将探讨如何在Spring Boot应用中实现文件的上传和下载功能&…

科普:什么是 BC-404 ?全方位解读最新通缩型 NFT 标准

区块链技术飞速发展的今天,创新从未停歇。继 ERC-404 标准问世后,一个名为 BC-404 的新标准应运而生,为 NFT 市场带来了全新的可能性。BC-404(Bonding Curve 404)—基于对 ERC-404 的改进,加密货币中第一个…

在ROS2中蓝牙崩溃的原因分析

在ROS2中,如果蓝牙模块没有成功启动,可能的原因有几个方面: 1. **硬件问题**:首先需要确认蓝牙硬件本身是否正常工作,包括检查蓝牙模块是否正确连接到系统,以及模块是否存在物理损坏。 2. **驱动问题**&a…

三、知识库搭建

知识库搭建 1 介绍词向量向量数据库 2 使用embedding API3 数据处理数据加载数据清洗文档分割 4 搭建并使用向量数据库4.1 自定义embedding封装4.2 chroma数据库4.3 向量检索 详细代码参考:https://github.com/lin902/llm-application 1 介绍 词向量 词向量就是把…

logging日志级别介绍

1 日志的等级可以分为5个 从底到高分别是 debug 程序调式bug使用 info 程序正常运行 warning 发出警告 error 程序出错 critical 特别验证 程序不能运行 2 使用: import logging logging.debug(这是一个dug日志的信息) 3 设置logging的配置信息 创建…

RK3568平台开发系列讲解(调试篇)分析内核调用的利器 ftrace

🚀返回专栏总目录 文章目录 一. 指定 ftrace 跟踪器二、设置要 trace 的函数三、ftrace 的开关四、查看 trace五、trace-cmd 的使用六、trace-cmd 的常用选项6.1、查看可以跟踪的事件6.2、跟踪特定进程的函数调用6.3、函数过滤6.4、限制跟踪深度6.5、追踪特定事件沉淀、分享、…

MYSQL insert into select 遇到的一个错误 Truncated incorrect DOUBLE value: ‘完成‘

今日在mysql 使用insert into mysql 报错了 》》Truncated incorrect DOUBLE value: ‘完成’。 单独把select 拉出来查询没有问题,但是一和insert into就报错了。 这种insert into select的sql 如果用了where 条件请在条件上 完全遵从数据格式,&#x…

CesiumJS【Basic】- #016 多边形面渲染“花了”的问题

文章目录 多边形面渲染“花了”的问题1 目标2 问题代码3 修正后代码4 总结多边形面渲染“花了”的问题 1 目标 解决多边形的面“花了”的问题 2 问题代码 使用Cesium.PerInstanceColorAppearance渲染后出现色斑 import * as Cesium from "cesium";const viewer …

防火墙双机热备

防火墙双机热备 随着移动办公、网上购物、即时通讯、互联网金融、互联网教育等业务蓬勃发展,网络承载的业务越来越多,越来越重要。所以如何保证网络的不间断传输成为网络发展过程中急需解决的一个问题。 防火墙部署在企业网络出口处,内外网之…

Orangepi Zero2使用外设驱动库wiringOP配合时间函数驱动HC-SR04超声波测距模块

目录 一、HC-SR04超声波模块原理和硬件接线 1.1 超声波测距原理: 1.2 超声波时序图: 1.3 HC-SR04超声波模块硬件接线: 二、时间函数 2.1 时间函数gettimeofday()原型和头文件: 2.2 使用gettimeofday()函数获取当前时间的秒数…

【osgEarth】Ubuntu 22.04 源码编译osgEarth 3.5

下载源代码 git clone --depth1 https://dgithub.xyz/gwaldron/osgearth -b osgearth-3.5 下载子模块 git submodule update --init 如果下载不过来,就手动修改下.git/config文件,将子模块的地址替换成加速地址 (base) yeqiangyeqiang-Default-string…

打印一张A4纸多少钱?打印a4多少钱一张

在数字化日益发展的今天,打印服务依然是办公、学习和生活中不可或缺的一部分。对于广大用户来说,了解A4纸打印的价格成为选择打印服务的重要参考因素。那么,A4纸打印到底多少钱一张呢? 在琢贝云打印平台,打印价格非常实…

Arcengine 添加字段时,显示General function failuer

一、现象 Arcengine开发的时候,在addfield(添加字段)操作时,显示General function failuer。如下图所示: 二、问题原因 General function failuer是常规故障,问题原因是文件占用,只要把文件在…