【YOLO系列】yolo V1 ,V3,V5,V8 解释

文章目录

  • yolo V1 模型结构图
    • 通道数 的 物理意义是什么?
    • 输出 7×7×30 怎么理解?
    • YOLO v1 损失函数LOSS
  • yolo V3
  • yolo V5
  • yolo V8

视频来源:https://www.bilibili.com/video/BV13K411t7Zs/


AI视频小助理
一、YOLO系列的目标检测算法,其中详细讲解了U6V1的网络结构,包括卷积层、池化层、通道数等基础知识。
00:01 - 介绍YOLO系列的目标检测算法
01:36 - 详细介绍yolo V1的网络结构,包括卷积层和池化层
05:17 - 解释通道数的意思和物理意义,以及卷积神经网络中的卷积核和通道数的关系
二、卷积神经网络的基本概念和结构,以及如何通过网络输出预测图像中的目标检测结果,详细解释了网络中各个参数的意义。
06:15 - 192个卷积核对应192个特征,对应原图表达。
07:18 - 特征图通道数为1024,经过4096全连接后转化为输出形状77×30。
08:22 - 输出结果为774×30的数字向量,每个数字代表原图小格子的预测结果。
三、目标检测模型的预测过程和输出结果,以及该模型的损失函数设计。其中,置信度和类别概率等概念被提及。
12:29 - 每个格子预测两个物体,但大量的预测是背景。
14:29 - 每个格子的置信度代表该位置是物体的概率
17:46 - YOLO的损失函数包含四个加号,其中第一个加号涉及到数学计算。
四、YOLO系列算法中的损失函数,包括中心坐标、宽高等预测结果的调整以及置信度的拟合,最后还介绍了YOLOv3的复杂结构和计算方法。
18:43 - 损失函数中加入中心坐标点,使其越来越准确
19:38 - 损失函数中加入宽高拟合,让预测结果与真实结果越接近越好
23:53 - YOLO v3模型有三个通路,经过卷积、批量归一化和激活函数处理
五、CBL、RESNET等深度学习中的小零件,以及这些零件如何拼接成复杂的结构,从而提取不同尺寸的信息,提高预测效果。
24:56 - CBL、卷积、批量规划、激活函数等深度学习小零件的拼接搭建整个网络结构。
26:40 - 不同尺寸信息提取可以提高预测效果,V3、V5、V8结构设计相似,但V8使用了更新数据进行训练。
28:56 - yolo V5和V8的网络结构复杂,越靠近输入层获取到的特征越细节,越靠上的特征越宏观
–本内容由AI视频小助理生成,关注解锁AI助理,由@Triticale21 召唤发送


yolo V1 模型结构图

在这里插入图片描述

通道数 的 物理意义是什么?

每一个通道 都是 由 1个卷积核 经过卷积运算 获得的输出结果
192个通道 对应 192个卷积核,这192个卷积核在训练过程中彼此独立,参数都是各自更新的,所以这192个卷积核 可以看作是 192个小特征!

输出 7×7×30 怎么理解?

只要物体的中心点落在这个格子内,就交给这个格子 来 预测!

每个格子要 预测两个物体,所以有两份 xywhc,xywhc,c 是置信度,20是类别概率

在这里插入图片描述

YOLO v1 损失函数LOSS

理解 意义
在这里插入图片描述

yolo V3

理解:提取 不同 尺寸 信息,让yolo 适用于 大尺寸的物体 和 小尺寸的 物体

越靠近输入,特征越细节;
越靠近输出,特征越宏观,越具体(高层语义)

在这里插入图片描述

yolo V5

模型 更复杂了,但还是3个分支
在这里插入图片描述

yolo V8

这个输出 是 3分支 检测吗?【有点像 自己任务想的输出了?】
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/588870.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python+opencv实现图片/短视频一键去水印

目录 0 前言1 准备工作2 读取图片或视频3 添加回调获取鼠标绘制水印区域4 调用opencv函数5 绘制蒙版主循环6 去水印主循环总结 0 前言 在制作ppt个人文章或者分享图片过程中,经常会遇到一些带有水印的情况,不少人都希望能够去除这些水印,提高…

2024如何成为一名合格的全栈开发者

我的新书《Android App开发入门与实战》已于2020年8月由人民邮电出版社出版,欢迎购买。点击进入详情 在当今快速发展的技术环境中,对多才多艺和技能熟练的专业人员的需求正在不断增加。 全栈开发人员是一个非常受欢迎的角色。 本文将深入了解什么是全栈…

【Linux】Linux

Linux 文章目录 Linux1. 简介2. 目录结构3. vi/vim 的使用4. 网络配置4.1 配置网络ip地址4.2 配置主机名或ip映射4.3 远程登陆及上传下载 5. 系统管理5.1 service 服务管理(CentOS 6 版本)5.2 systemctl 服务管理(CentOS 7 版本)5…

thinkphp6.0升级到8.0

目录 一:升级过程 二:报错处理 最近写的项目需要使用thinkphp8.0,之前的老项目需要从php6.0升级到8.0,特此记录下升级过程。 一:升级过程 查看版本: php think version,我目前的版本是6.1.4 生成thin…

Java项目:103SSM酒店管理系统

博主主页:Java旅途 简介:分享计算机知识、学习路线、系统源码及教程 文末获取源码 一、项目介绍 酒店管理系统基于SpringSpringMVCMybatis开发,功能简单,可用于毕设或者课程设计。 管理员功能如下: 房间管理住客入住…

图像去雾/图像去雨(matlab/python)

图像去雾和图像去雨是计算机视觉领域的两个重要问题,旨在改善被大气条件或降雨影响而模糊或噪声化的图像质量。这两个技术在很多实际应用中具有广泛的价值,包括无人驾驶、安防监控、航空航天等领域。下面将分点介绍图像去雾和图像去雨的相关内容。 1. 图…

Debezium发布历史40

原文地址: https://debezium.io/blog/2018/09/20/materializing-aggregate-views-with-hibernate-and-debezium/ 欢迎关注留言,我是收集整理小能手,工具翻译,仅供参考,笔芯笔芯. 使用 Hibernate 和 Debezium 实现聚合…

2021-06-25 51蛋骗鸡按键切合LED

缘由ISIS 7 Professional_有问必答-CSDN问答 #include "REG52.h" sbit K1 P3^0; sbit K2 P3^1; sbit K3 P3^2; sbit K4 P3^3; void main() {unsigned char Xd0,xz0,cs0;unsigned int wei0;P1255;while(1){if(K10&&Xd0){P10;while(K10);}if(K20&&…

【Redis-05】Redis如何实现保存键值对的保存及过期键的管理策略

在之前的文章我们介绍过,Redis服务器在启动之初,会初始化RedisServer的实例,在这个实例中存在很多重要的属性结构,同理本篇博客中介绍的数据库实现原理也会和其中的某些属性相关,我们继续看一下吧。 1.服务器和客户端…

【后端】Docker学习笔记

文章目录 Docker一、Docker安装(Linux)二、Docker概念三、Docker常用命令四、数据卷五、自定义镜像六、网络七、DockerCompose Docker Docker是一个开源平台,主要基于Go语言构建,它使开发者能够将应用程序及其依赖项打包到一个轻…

多维时序 | MATLAB实现SSA-CNN-GRU-SAM-Attention麻雀算法优化卷积网络结合门控循环单元网络融合空间注意力机制多变量时间序列预测

多维时序 | MATLAB实现SSA-CNN-GRU-SAM-Attention麻雀算法优化卷积网络结合门控循环单元网络融合空间注意力机制多变量时间序列预测 目录 多维时序 | MATLAB实现SSA-CNN-GRU-SAM-Attention麻雀算法优化卷积网络结合门控循环单元网络融合空间注意力机制多变量时间序列预测预测效…

uni-app模版(扩展插件)

锋哥原创的uni-app视频教程: 2023版uniapp从入门到上天视频教程(Java后端无废话版),火爆更新中..._哔哩哔哩_bilibili2023版uniapp从入门到上天视频教程(Java后端无废话版),火爆更新中...共计23条视频,包括:第1讲 uni…

使用css实现 Typora markdown 标题自动编号

第一,找到主题文件夹 第二,复制下面代码放入 AutoNumber.css文件中 body {counter-reset: h1; }#write h1, .markdown-section h1 {counter-reset: h2; }#write h2, .markdown-section h2 {counter-reset: h3; }#write h3, .markdown-section h3 {counte…

分割数组的最大差值 - 华为OD统一考试

分割数组的最大差值 - 华为OD统一考试 OD统一考试 分值: 100分 题解: Java / Python / C 题目描述 给定一个由若干整数组成的数组nums ,可以在数组内的任意位置进行分割,将该数组分割成两个非空子数组(即左数组和右数组)&#xf…

第三部分 连续型需要的积分

目录 温馨提示: 求积分 求分段函数在确定区间的定积分 方法: 例1 例2 例3 例4 例5 例6 例7 求分段函数在到未知数的定积分 方法: 例8 求简单的二重积分 方法: 例9 例10 例11 求f(x,y)的二重积分 方法: 例12 例13 …

Langchain-Chatchat开源库使用的随笔记(一)

笔者最近在研究Langchain-Chatchat,所以本篇作为随笔记进行记录。 最近核心探索的是知识库的使用,其中关于文档如何进行分块的详细,可以参考笔者的另几篇文章: 大模型RAG 场景、数据、应用难点与解决(四)R…

怎么解决 Nginx反向代理加载速度慢?

Nginx反向代理加载速度慢可能由多种原因引起,以下是一些可能的解决方法: 1,网络延迟: 检查目标服务器的网络状况,确保其网络连接正常。如果目标服务器位于不同的地理位置,可能会有较大的网络延迟。考虑使用…

Good Bye 2023

Good Bye 2023 Good Bye 2023 A. 2023 题意:序列a中所有数的乘积应为2023,现在给出序列中的n个数,找到剩下的k个数并输出,报告不可能。 思路:把所有已知的数字乘起来,判断是否整除2023,不够…

Android Studio如何创建尺寸大小及API通用的模拟器

目录 前言 一、操作步骤 二、总结 三、更多资源 前言 在开发移动应用程序的过程中,使用模拟器进行测试是一种常见和方便的方式。Android Studio是一款功能强大的集成开发环境,它提供了创建和管理模拟器的功能。在本文中,我们将介绍如何创…

qs.stringify 使用arrayFormat属性 + allowDots的数据处理 - 附示例

qs:将url中的参数转为对象;将对象转为url参数形式 一、介绍 1、官方文档: https://github.com/ljharb/qs https://github.com/ljharb/qshttps://github.com/ljharb/qs 二、准备工作 1、安装依赖包 npm install qs --save 2、示例版本 &…