YOLOv8模型代码学习

1.参考文献

链接1

2.网络模型解析

2.1卷积神经单元(conv.py)

在该文件中定义了yolov8网络中的卷积神经单元,位置如图所示。

def autopad(k, p=None, d=1):  # kernel(卷积核), padding(填充), dilation(扩张)"""Pad to 'same' shape outputs."""# 返回pad的大小,使得padding后输出张量的shape不变if d > 1:  # 如果采用扩张卷积,则计算扩张后实际的kernel大小k = d * (k - 1) + 1 if isinstance(k, int) else [d * (x - 1) + 1 for x in k]  # actual kernel-sizeif p is None:p = k // 2 if isinstance(k, int) else [x // 2 for x in k]  # auto-pad # 自动padreturn p

2.1.1代码解释

  • 扩张卷积的处理
if d > 1:  # 如果采用扩张卷积,则计算扩张后实际的kernel大小k = d * (k - 1) + 1 if isinstance(k, int) else [d * (x - 1) + 1 for x in k]  # actual kernel-size

这部分代码的作用是,如果 d 大于1,则计算扩张卷积后的实际卷积核大小。对于扩张卷积,其有效卷积核大小会增大:

  1. 如果 k 是一个整数,新的卷积核大小为 d * (k - 1) + 1
  2. 如果 k 是一个列表,则对列表中的每一个元素 x 进行相同的计算,生成新的列表。
  • 自动填充计算
if p is None:p = k // 2 if isinstance(k, int) else [x // 2 for x in k]  # auto-pad # 自动pad

这部分代码的作用是,如果没有显式指定填充大小 p(即 pNone),则自动计算填充大小以保持输出形状不变:

  1. 如果 k 是一个整数,则填充大小为 k // 2
  2. 如果 k 是一个列表,则对列表中的每一个元素 x 进行 x // 2 的计算,生成新的列表。
  • 返回填充大小
return p

最后返回计算出的填充大小 p

2.1.2示例

1:普通卷积,3x3卷积核

假设我们有一个3x3的卷积核,扩张率 d=1(即没有扩张),并且没有指定填充 p

k = 3
p = autopad(k, p=None, d=1)
print(p)  # 预期输出: 1
  • 计算过程:
  1. 没有扩张,卷积核大小保持3x3。
  2. 自动填充 p 计算:p = k // 2 = 3 // 2 = 1

输出的填充大小为1,这意味着每边需要填充1个像素,使得输出张量的形状与输入张量相同。

2:扩张卷积,3x3卷积核,扩张率2

假设我们有一个3x3的卷积核,扩张率 d=2,并且没有指定填充 p

k = 3
p = autopad(k, p=None, d=2)
print(p)  # 预期输出: 2
  • 计算过程:
  1. 扩张后,实际卷积核大小:k = d * (k - 1) + 1 = 2 * (3 - 1) + 1 = 5
  2. 自动填充 p 计算:p = k // 2 = 5 // 2 = 2

输出的填充大小为2,这意味着每边需要填充2个像素,使得输出张量的形状与输入张量相同。

3:矩形卷积核,5x7卷积核

假设我们有一个5x7的矩形卷积核,扩张率 d=1,并且没有指定填充 p

k = [5, 7]
p = autopad(k, p=None, d=1)
print(p)  # 预期输出: [2, 3]

  • 计算过程:
  1. 没有扩张,卷积核大小保持5x7。
  2. 自动填充 p 计算:p = [x // 2 for x in k] = [5 // 2, 7 // 2] = [2, 3]

输出的填充大小为 [2, 3],这意味着高度方向需要填充2个像素,宽度方向需要填充3个像素,使得输出张量的形状与输入张量相同。

4:矩形卷积核,5x7卷积核,扩张率2

假设我们有一个5x7的矩形卷积核,扩张率 d=2,并且没有指定填充 p

k = [5, 7]
p = autopad(k, p=None, d=2)
print(p)  # 预期输出: [4, 6]
  • 计算过程:
  1. 扩张后,实际卷积核大小:k = [d * (x - 1) + 1 for x in k] = [2 * (5 - 1) + 1, 2 * (7 - 1) + 1] = [9, 13]
  2. 自动填充 p 计算:p = [x // 2 for x in k] = [9 // 2, 13 // 2] = [4, 6]

输出的填充大小为 [4, 6],这意味着高度方向需要填充4个像素,宽度方向需要填充6个像素,使得输出张量的形状与输入张量相同。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/34435.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

解决Java中的InstantiationException异常的技术指南

解决Java中的InstantiationException异常的技术指南 大家好,我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编,也是冬天不穿秋裤,天冷也要风度的程序猿! 在Java编程中,InstantiationException异常是开…

Python中位运算详解

✨前言: 在Python中,位运算用于直接操纵数值的二进制位。以下是Python中的几种位运算符,每个位运算符的功能及其使用实例: ✨按位与(AND) - & 当两个操作数的位都为1时,结果的相应位才是…

Nginx日志管理之错误日志配置

Nginx 的错误日志可以帮助用户及时判断 Nginx 配置及运行时出错的原因,错误日志也可以通过 Nginx 内置指令进行配置,但不支持格式定义。配置指令如下表所示。 说明 错误日志指令组成主指令error_log作用域main、http、mail、stream、server、location默…

坐标传送指令

目录 主城传送 联盟 部落 中立 副本传送 旧世界(Vanilla 1.0) 燃烧的远征(TBC 2.0) 巫妖王之怒(WLK 3.0) 大灾变(CTM 4.0) 熊猫人之谜(MOP 5.0) 德…

Xlua三方库Android编译出错解决办法

Xlua三方库Android编译出错解决办法 最近听老师的热更教程,讲到xlua编译android平台会报错,也是看了老师的博客,按照方法去解决,然而问题并没有解决。应该是因为代码更新或者版本不一样,在此简单记录一下解决过程。 参…

Node.js 事件循环的工作流程

Node.js 的事件循环由六个主要阶段组成,每个阶段都有一个或多个回调队列。事件循环依次遍历这些阶段,并在每个阶段执行相应的回调函数。具体的流程如下: Timers(计时器阶段): 执行已到期的 setTimeout 和 s…

js 获取get请求请求时间

要获取GET请求的响应时间,可以使用JavaScript的XMLHttpRequest对象。以下是一个示例: function getResponseTime(url, callback) {var xhr new XMLHttpRequest();var startTime new Date().getTime();xhr.onreadystatechange function() {if (xhr.re…

[RPI4] 树莓派4b安装istoreos及使用 -- 1. 系统安装

最近在研究家庭智能化的一些东西,其中包括网络,智能家居等一系列内容,然后看过的资料有的想再回来看的时候就找不到了,然后就想着开这么一个系列,做一些记录,先从智能家居开始吧。 1 安装istoreos系统 iStoreOS 目标是提供一个人人会用的路由兼轻 NAS 系统,不管是作为路…

Transformer预测 | 基于Transformer的风电功率多变量时间序列预测(Matlab)

文章目录 预测效果文章概述模型描述程序设计参考资料预测效果 文章概述 Transformer预测 | 基于Transformer的风电功率多变量时间序列预测(Matlab) Transformer 模型本质上都是预训练语言模型,大都采用自监督学习 (Self-supervised learning) 的方式在大量生语料上进行训练,…

python桌面应用

py文件 import osimport wx import wx.html2class MyFrame(wx.Frame):def __init__(self, parent):wx.Frame.__init__(self, parent, title"启动啦", size(1000, 700))# 创建一个Web视图组件self.browser wx.html2.WebView.New(self)# 加载本地HTML文件# self.brow…

考研数学|《李林880》正确率多少算合格?

李林880题是针对考研数学三的练习题集,覆盖了考研数学三的主要知识点和题型。如果能够熟练掌握这些题目,意味着对考研数学三的知识点有了较为深入的理解和应用能力。 首先,考研数学三的总分是150分,题型包括单选题、填空题和解答…

RN开发搬砖经验之—“Calculated frame index should never be lower than 0“崩溃问题分析

问题重现 崩溃堆栈: Back traces starts. java.lang.RuntimeException: java.lang.IllegalStateException: Calculated frame index should never be lower than 0at com.facebook.react.animated.NativeAnimatedModule$1.doFrameGuarded(NativeAnimatedModule.ja…

PostgreSQL中 GROUPING SETS、CUBE 和 ROLLUP功能

PostgreSQL 中,GROUPING SETS、CUBE 和 ROLLUP 的功能,允许在查询中更灵活地生成聚合结果,而不需要多次重写查询或使用复杂的 UNION 语句。这些功能在数据分析中特别有用,因为它们允许你以不同的维度对数据进行分组和聚合。 1、测…

持久化容器数据

持久化容器数据 目录 容器卷管理卷试一试 使用卷查看卷内容删除卷 当一个容器启动时,它会使用镜像提供的文件和配置。每个容器可以创建、修改和删除文件,并且不会影响其他容器。当容器被删除时,这些文件更改也会被删除。 虽然容器的这种短…

【因果推断python】53_效应异质性和非线性带来的挑战1

目录 Treatment Effects on Binary Outcomes 合成一些数据 由于缺乏基本事实,在单位层面预测治疗效果极为困难。因为我们只能观察到一个潜在结果 T(t) ,我们无法直接估计它。相反,我们必须依靠目标变换(也可以看作是设计巧妙的损…

【专利】一种光伏产品缺陷检测AI深度学习算法

申请号CN202410053849.9公开号(公开)CN118037635A申请日2024.01.12申请人(公开)超音速人工智能科技股份有限公司发明人(公开)张俊峰(总); 叶长春(总); 廖绍伟 摘要 本发明公开一种光伏产品缺陷检测AI深度…

全国计算机二级C++题库笔记

全国计算机二级C题库笔记 Ⅰ. 选择题专项训练1 公共基础部分2 二级C程序设计第1~4章》每章标题1. C标识符命名规则2. 面向对象的三个主要特征3. C的四个开发步骤4. 关于类和对象的叙述5. !和&&的作用6. C枚举类型初值问题7. ASCII码对照表8. 运算符两边的数据类型&…

linux高级编程(I/O)

fputc int fputc(int c, FILE *stream); 功能: 向流中写入一个字符 参数: c:要写入的字符 stream:文件流指针 返回值: 成功返回写入的字符ASCII码值 失败返回EOF fgetc int fgetc(FILE *stream); 功能: 从流中读取一个字符 参数: stream:文件流…

SAPUI5基础知识8 - 模块(Module)的使用

1. 背景 在SAPUI5中,几乎所有东西都是一个模块(例如:控件,控制器,组件等等),通过依赖管理,模块间可以相互调用。这样做的好处是,可以仅在需要时才去加载必需的模块&…

基于单片机的智能台灯控制系统

摘要: 文章设计一款单片机智能台灯控制系统,实现对台灯的手动和自动控制功能,以 STC89C52 单片机作为多功能智能台灯的主控制器,光电检测模块检测坐姿,红外传感器检测人体,光敏电阻检测光强,同…