YOLOV1学习

YOLOV1学习(输入的图像固定大小为448X448X3)
参考文献

模型结构

将输入的图像归一化为大小为448x448x3的图像,然后将经过中间24层的卷积后得到了7x7x1024的特征图,然后后面连接的是两个全连接层,分别是4096和1470,最后将1470reshape成7x7x30的张量。

问题0:①为什么是30,又为什么是7?②怎么解析?
答:①为什么是7是因为将输入图像划分成了7x7的grid cell,30是因为每个grid cell都会生成两个预测框,每个预测框又有5个参数(x,y,h,w,c),又因为这里是针对Pascal 数据集进行设计的,这个数据集中含有20个类,因此会有20个类别条件概率,因此对于每一个grid cell都有**(2x5+20=30)30个参数需要记录,因此最终的矩阵为7x7x30**
②根据①知道了每一个深度方向的信息代表什么,因此我们可以根据这个进行解析。深度方向有30维通道,1-5通道是第一个bounding box的x,y,h,w,c, 6-10是第二个bounding box的x,y,h,w,c,后面11-30则是每一类的条件概率值【p(第i类)/p(含物体)】。

注:真正的类别概率是:每一类的条件概率乘以置信度
置信度=p[object]是否包含物体的概率,条件概率=p【属于第i类的概率】/p[object]
p【属于第i类的概率】=置信度 * 条件概率

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-wVF2VAoW-1629564873766)(en-resource://database/533:1)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ZonZ4xEu-1629564873769)(en-resource://database/527:1)]

预测阶段

一、模型训练好的前提下目标检测的大体步骤

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-qT5dGEKL-1629564873772)(en-resource://database/529:1)]

步骤一:划分网格

先将输入的图像划分为sxs个大小相等的网格;(s=7),每一个网格称之为grid cell
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-2VR96r7v-1629564873775)(en-resource://database/519:1)]

问题1:这样划分的目的是什么?
答:用于生成预测框,将预测框的中心限制在网格中

步骤二:生成预测框bounding box

每个grid cell都会生成两个预测框,且预测框的中心在grid cell内,预测框的参数有:中心坐标(x,y),框宽高(h.w),以及是否为一个物体的置信度c(反应在框的粗细中,粗框表示置信度高),这里共生成7x7x2 = 98个bounding box
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-FmjqlIXq-1629564873780)(en-resource://database/521:1)]

问题2:每一个grid cell的2个预测框是怎么生成的?
答:根据参数x,y,h,w,c生成的
问题3:怎么得到这几个参数?
根据7x7x30的矩阵所得

步骤三:生成条件概率

每一个grid cell还会预测一组条件类别概率,即在包含物体的前提下,是某一类物体的概率,称之为条件概率。根据条件概率可以绘制下图的class probability map图,每一个颜色表示不同的类别,这里是将20个概率中取最大的概率作为最终的概率绘制出来的
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-wWlVAkbE-1629564873783)(en-resource://database/523:1)][外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-A9rAIVBZ-1629564873785)(en-resource://database/535:1)]

问题4:条件概率有什么作用?
答:将每一个bounding box的置信度乘以条件概率,就可以得到bounding box的各类别的概率。
问题5:条件概率是怎么计算得到的?
根据7x7x30的矩阵所得

步骤四:根据步骤二和步骤三生成预测结果

根据bounding box和类别概率就可以得到预测结果。即根据问题4中得到的概率,就可以判别出每一个bounding box最终的预测结果,将属于背景的box剔除,然后利用NMS进行非极大值抑制,就得到了目标检测的结果
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-gnMCt2zA-1629564873787)(en-resource://database/537:1)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-F8NY3Ge5-1629564873790)(en-resource://database/531:1)]

问题6
①怎么训练网络,得到网络的参数,进而能够进行目标检测?
②怎么判断grid cell是否含有物体

二、预测阶段,后处理

1、预测阶段

对于一个grid cell来说,有两个预测框,每个预测框都有一个20维的类别概率,因此有每一个grid cell都会得到两个全概率即2x20,对于7x7的grid cell来说,就会得到7x7x2=98个20维的全概率向量
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-NBcALAj8-1629564873794)(en-resource://database/539:1)]

2、后处理

后处理其实就是将98个预测框中低置信度的框和重复的框剔除,这个过程称之为NMS
① 先设置一个阈值,对于同一个类别概率小于p_thre的grid cell全部设置为0
②将不为0的grid cell按照高低顺序进行排列,取出概率最大的预测框;
③将所有的框跟概率大的框计算交并比,IOU,若交并比大于某一个阈值,则表明预测了同一个物体,将低概率的概率设置为0,;若交并比小于某一个阈值,则说明不是预测的同一个物体,保留这个预测框;
④对于每一个类别都是重复①-③步骤(即NMS),进行20次NMS后就会得到最终的结果。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Z2Nyaww8-1629564873797)(en-resource://database/541:1)]

训练阶段

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/255855.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

KUKA通信 CREAD问题

嗨。 我想通过串行端口1发送X,Y,Z,A,B,C坐标给机器人。 G1: ...... CREAD(HANDLE,SR_T,MR_T,TIMEOUT,OFFSET,"%F",X) P.XX CREAD(HANDLE,SR_T,MR_T,TIMEOUT,OFFSET,"%F",Y) P.YY ...... GOTO G1…

bzoj 1901: Zju2112 Dynamic Rankings

Time Limit: 10 Sec Memory Limit: 128 MBSubmit: 6245 Solved: 2593[Submit][Status][Discuss]Description 给定一个含有n个数的序列a[1],a[2],a[3]……a[n],程序必须回答这样的询问:对于给定的i,j,k,在a[i],a[i1],a[i2]……a[j]中第k小的…

第 36 章 RRDTool

36.1. install $ apt-get install rrdtool原文出处:Netkiller 系列 手札 本文作者:陈景峯 转载请与作者联系,同时请务必标明文章原始出处和作者信息及本声明。

手机号码已经注册写到数据库中,如何利用相同手机号码再次注册?

手机号码已经注册写到数据库中,如何利用相同手机号码再次注册? 解:删除数据库中以前注册的手机号码就可以了啊,delete那条记录,转载于:https://www.cnblogs.com/panxuejun/p/6122499.html

腾讯技术研究类和数据分析第一次笔试(2021.8.22)——Python

第一题:开锁——数学期望 # 最优策略:钥匙的选择先从消耗时间最少的开始选择,然后选择第二小的依次类推 # 开锁概率1/n def openLockTime(n, m, time):time_reverse [] # (n,m)->(m,n)for i in range(m):m_time []for j in range(n):m…

教你怎样选择伺服电机控制方式

伺服电机一般都有三种控制方式:速度控制方式,转矩控制方式,位置控制方式 。 速度控制和转矩控制都是用模拟量来控制的。位置控制是通过发脉冲来控制的。具体采用什么控制方式要根据客户的要求,满足何种运动功能来选择。 …

.Net Discovery系列之四 深入理解.Net垃圾收集机制(下)

上一节给大家介绍了 .Net GC的运行机制,下面来讲下与GC相关的重要方法。 第二节.GC关键方法解析 1.Dispose()方法 Dispose可用于释放所有资源,包括托管的和非托管的,需要自己实现。 大多数的非托管资源都要求手动释放,…

真静态和伪静态的区别

首先肯定的是纯静态和伪静态都是SEO的产物,但纯静态和伪静态还是有很大区别的。 纯静态是生成真实的HTML页面保存到服务器端,用户访问时直接访问这 个HTML页面即可,从而大大的减轻了服务器压力(如dedecms就是采用的纯静态&#xf…

非常有趣的Console

console觉醒之路,打印个动画如何? 原文地址: http://www.helloweba.com/view-blog-383.html 批量去掉或替换文本中的换行符(notepad、sublime text2) 原文地址:http://m.blog.csdn.net/article/details?id43228729 有…

shopee虾皮科技测试工程师第一次笔试

10道单选题 10道多选题 2道编程题 第一题:十进制转二进制计算1的个数(负数转为补码) #!/usr/bin/env python # -*- coding: utf-8 -*- # Time : 2021/8/23 15:44 # Author : linlianqin # Site : # File : 十进制转换为二进制&am…

假期实践

第一天 地点:杭州颐高数码城 第一天,我来到了自己家附近的颐高数码城。文三路这边有一个卖数码产品的一条街,这里也是最贴近我专业实践的地方,所以第一天的实践我选择了这里。 2001年开业的颐高数码广场座落于“电子一条街”文三路、学院路口…

3.AngularJS-过滤器

转自:https://www.cnblogs.com/best/p/6225621.html 二、过滤器 使用过滤器格式化数据,变换数据格式,在模板中使用一个插值变量。语法格式如下: {{ express | filter:parameter1:p2:p3… | … | …}} 过滤器分了内置过滤器与自定义…

webstorm卡顿问题

解决webstorm卡顿问题 webstorm强大的功能就不多做介绍了。但是它的缺点也显而易见:吃内存。 电脑配置稍低一点,运行webstorm就特别容易卡顿,特别是项目比较大的时候,那卡顿得不要不要的。 在我的笔记本8g内存 256ssd的配置下&…

cmd.exe启动参数说明

启动命令解释程序 Cmd.exe 的新范例。如果在不含参数的情况下使用,cmd 将显示操作系统的版本和版权信息。 语法 cmd [{/c | /k}] [/s] [/q] [/d] [{/a | /u}] [/t:FG] [/e:{on | off}] [/f:{on | off}] [/v:{on | off}] [String] 参数 /c 执行 String 指定的命令&am…

【深度学习】——训练过程

包含哪些层 训练过程 其实就是yf(x)的求参过程,先给参数一个初始值,然后根据初始函数计算得到预测值,根据预测值和真值计算损失,然后又根据损失函数进行反向传播更新参数,更新参数后,再次计算预测值&#…

ABB RAPID 程序 WorldZone 归纳

在 RAPID 程序中,静态的 WorldZone 不能被解除并再次激活,或者进行擦除。在 RAPID 程序中, 临时的 WorldZone 可以被解除(WZDisable) , 再次激活(WZEnable) 或者擦除(WZF…

thinkphp自定义模板标签(一)

thinkphp内置的foreach和include等模板标签使用是非常方便的;但是内置的那些标签只能满足常用功能,个性化的功能就需要我们自己编写自定义模板标签了;下面就是要讲解如何实现; 示例环境:thinkphp3.2.3 thinkphp的模板标…

【深度学习】——激活函数(sigmoid、tanh、relu、softmax)

目录 激活函数 1、作用 2、常用激活函数 3、衡量激活函数好坏的标准: 4、不同的激活函数 1)sigmoid 2)tanh函数 3)RULE函数和leak-relu函数 4)softmax函数 激活函数 1、作用 如果只是线性卷积的话&#xff0c…

SDUT 3377 数据结构实验之查找五:平方之哈希表

数据结构实验之查找五:平方之哈希表 Time Limit: 400MS Memory Limit: 65536KBSubmit StatisticProblem Description 给定的一组无重复数据的正整数,根据给定的哈希函数建立其对应hash表,哈希函数是H(Key)Key%P,P是哈希表表长&…

我的2017年前端之路总结

原文首发于我的博客 年末了,赶着刚考完两门考试,在最后4门考试来临之前抽空写一下今年的小结。 今年格外忙。忙完本科毕设,又马上投入了研究生实验室的搬砖生涯。跟去年一样,列个今年的学习成果清单: 过去的一年 技术成…