YOLOV3代码分析

文件夹和文件的作用

  • config:文件的配置:
    1.coco.data:存放coco数据集的相关信息,如类别总数,数据集的路径等
    2.yolov3.cfg: yolov3的网络架构

  • data:存放训练集和测试集
    1.coco:存放coco训练集和测试集

    labels中存放每个照片的标签,分别放在一个txt文件中
    5k.txt存放验证集的每一个照片的路径
    coco.names存放各种分类的名称
    trainvalno5k.txt存放训练集和验证集每一个照片的路径

  • output:预测结果存放路径

  • utils:工具类存放
    1.augmentations.py:图片的反转
    2.datasets.py:

    • 导入模块:

    glob模块用来查找文件目录和文件,并将搜索的到的结果返回到一个列表中,

    torch.nn.functional与torch.nn的区别:torch.nn.functional.x 为函数,与torch.nn不同, torch.nn.x中包含了初始化需要的参数等 attributes 而torch.nn.functional.x则需要把相应的weights 作为输入参数传递,才能完成运算, 所以用torch.nn.functional创建模型时需要创建并初始化相应参数.
    torch.nn.x初始化要在__init__中,torch.nn.functional参数初始化在__init()__中,而使用的时候在forward(参数)中。torch.nn.functional.conv2d(input, weight, bias=None, stride=1, padding=0, dilation=1, groups=1)
    torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1, bias=True, padding_mode=‘zeros’)

    torch.utils.data中的Dataset和DataLoader, Dataset是对数据进行封装,DataLoader是数据加载,从Dataset中取一个批次的数据。
    transforms主要实现对数据集的预处理、数据增强、转换成tensor等一系列操作

    • 函数:

    pad_to_square:如果图像不是正方形,则将其填充成正方形。h>=w,就将w填充成与h一样长,反之亦然。

    resize:将图像变成指定的size

    random_size:为了使模型适应各种size的输入,将图片随机变为一个size,但是这个size要是32的倍数,因为网络进行五次下采样。

    • 类:

    ImageFolder:

    ListDataset:对数据集进行封装,继承Dataset

    __init():找到训练集的所有照片的路径和对应的标签路径,初始化其他参数

    __getitem():取出index对应的训练集照片,将其填充为正方形。取出对应的标签,将标签转化为填充后的标签值。将标签和照片随机进行反转。

    collate_fn():

    len:返回数据集的长度

3.parse_config.py:

parse_model_config:path为网络配置的路径,如yolov3.cfg。从对应的网络配置中一层层读取网络信息,添加到module_defs中。如果是卷积层就不需要归一化

4.utils.py:

build_targets():根据预测结果的batch_size,anchor box,classes,gridsize初始化各种参数,然后计算所有3*anchor boxes,这里的anchor boxes是所有像素点对应的框。
用真实框与预测框计算iou值,并返回这三种框中那个框和真实框最接近以及相应的得分。然后将检测都最高得分的anchor 所在格子的相应参数置为1
真实标签值的xy是除以了整张图片的wh的,在01直接,而求出来的xy是相对于gridsize的偏移量,也是01之间。

  • weights:权重存放路径

  • detect.py:解析参数,配置模型,加载权重,然后预测出一个bounding box,计算每次预测的时间,最后画图并存放结果。

  • models.py:模型的配置
    1.函数:

    create_modules:nn.Sequential按顺序执行网络块,自定义了forward,而nn.ModuleList没有,需要循环来对每个网络模块forward,而且它的网络模块可以不按照顺序执行。
    根据module_defs中的每个模块去构建网络结构
    2.类:
    Darknet:
    forward用于一层一层前向module(x),如果是yolo层还有计算损失函数

    YOLOLayer:
    compute_grid_offsets计算每个格子的坐标,在前向传播中用来将bbox对于边界框的位置还原成绝对坐标
    forward 将预测结果整理成output,与真实标签计算损失函数,还有各种指标

  • train.py:训练模型

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/90561.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Servlet开发-session和cookie理解案例-登录页面

项目展示 进入登录页面,输入正确的用户名和密码以后会自动跳到主页 登录成功以后打印用户名以及上次登录的时间,如果浏览器和客户端都保存有上次登录的信息,则不需要登录就可以进入主页 编码思路 1.首先提供一个登录的前端页面&…

ubuntu http 服务器响应

代码&#xff1a; h文件 #include <iostream> #include <curl/curl.h>#include <net/if.h> #include <sys/ioctl.h> #include <arpa/inet.h> #include <string.h>#include <event.h> #include <event2/http.h> #include <…

DDS信号发生器Verilog波形发生器FPGA

名称&#xff1a;DDS信号发生器Verilog波形发生器 软件&#xff1a;Quartus 语言&#xff1a;Verilog 要求&#xff1a; 1.可产生正弦波&#xff0c;锯齿波&#xff0c;三角波&#xff0c;方波4种波形&#xff0c;频率可调 2.具有波形选择、起动、停止功能。 代码下载&…

QT信号槽

目录 信号槽的概念 按钮的常用信号 自定义槽函数 自定义信号函数 自定义槽和信号注意的事项 信号与槽的拓展 lambda表达式 信号槽的概念 信号槽是Qt框架引以为豪的机制之一。所谓信号槽&#xff0c;实际就是观察者模式。当某个事件发生之后&#xff0c;比如&#xff0c…

一篇博客学会系列(2)—— C语言中的自定义类型 :结构体、位段、枚举、联合体

目录 前言 1、结构体 1.1、结构体类型的声明 1.2、特殊的结构体类型声明 1.3、结构体的自引用 1.4、结构体的定义和初始化 1.5、结构体成员变量的调用 1.6、结构体内存对齐 1.6.1、offsetof 1.6.2、结构体大小的计算 1.6.3、为什么存在内存对齐&#xff1f; 1.7、…

【WIN32】C++在打印Windows中调用堆栈信息

C在打印Windows中调用堆栈信息 关键函数 GetCurrentProcess 返回当前进程的伪句柄 伪句柄是一个特殊常量&#xff0c;当前 (HANDLE) -1&#xff0c;被解释为当前进程句柄。 为了与将来的操作系统兼容&#xff0c;最好调用 GetCurrentProcess &#xff0c;而不是硬编码此常量…

Linux账户组管理及权限练习

1.使用id命令查看root账户信息 [rootserver ~]# id root 用户id0(root) 组id0(root) 组0(root) 2.使用id命令查看自己的普通账户信息 [rootserver ~]# id kxy 用户id1000(kxy) 组id1000(kxy) 组1000(kxy),10(wheel) 3.新建账户test1&#xff0c;并查看账户信息&#xff1a; [ro…

BASH shell脚本篇3——字符串处理

这篇文章介绍下BASH shell中的字符串处理的相关命令。之前有介绍过shell的其它命令&#xff0c;请参考&#xff1a; BASH shell脚本篇1——基本命令 BASH shell脚本篇2——条件命令 Bash字符串也是一种数据类型&#xff0c;它用于表示文本而不是数字&#xff0c;它是一组可能…

No150.精选前端面试题,享受每天的挑战和学习

🤍 前端开发工程师(主业)、技术博主(副业)、已过CET6 🍨 阿珊和她的猫_CSDN个人主页 🕠 牛客高级专题作者、在牛客打造高质量专栏《前端面试必备》 🍚 蓝桥云课签约作者、已在蓝桥云课上架的前后端实战课程《Vue.js 和 Egg.js 开发企业级健康管理项目》、《带你从入…

后台管理系统: 商品管理

商品管理之三级联动静态组件 先做俩个卡片组件&#xff0c;分开距离 三级联动很多地方都用到了它&#xff0c;我们可以封装成一个组件 注册为一个全局组件 <div><el-form :inline"true" class"demo-form-inline"><el-form-item label&qu…

1200*A. Flipping Game(前缀和)

解析&#xff1a; 100数据量&#xff0c;两层遍历每个区间&#xff0c;然后前缀和计算1的个数&#xff0c;维护最大值即可。 #include<bits/stdc.h> using namespace std; #define int long long const int N110; int n,a[N],res,sum[N]; signed main(){scanf("%ll…

Python标准库分享之时间与日期 (time, datetime包)

Python具有良好的时间和日期管理功能。实际上&#xff0c;计算机只会维护一个挂钟时间(wall clock time)&#xff0c;这个时间是从某个固定时间起点到现在的时间间隔。时间起点的选择与计算机相关&#xff0c;但一台计算机的话&#xff0c;这一时间起点是固定的。其它的日期信息…

目标检测:FROD: Robust Object Detection for Free

论文作者&#xff1a;Muhammad,Awais,Weiming,Zhuang,Lingjuan,Lyu,Sung-Ho,Bae 作者单位&#xff1a;Sony AI; Kyung-Hee University 论文链接&#xff1a;http://arxiv.org/abs/2308.01888v1 内容简介&#xff1a; 1&#xff09;方向&#xff1a;目标检测 2&#xff09;…

性能优化实战使用CountDownLatch

1.分析问题 原程序是分页查询EventAffinityScoreDO表的数据&#xff0c;每次获取2000条在一个个遍历去更新EventAffinityScoreDO表的数据。但是这样耗时比较慢&#xff0c;测试过30万的数据需要2小时 private void eventSubjectHandle(String tenantId, String eventSubject) …

3.6+铁死亡+WGCNA+机器学习

今天给同学们分享一篇3.6铁死亡WGCNA机器学习的生信文章“Identification of ferroptosis related biomarkers and immune infiltration in Parkinsons disease by integrated bioinformatic analysis”&#xff0c;这篇文章于2023年3月14日发表在BMC Med Genomics期刊上&#…

队列的使用以及模拟实现(C++版本)

&#x1f388;个人主页:&#x1f388; :✨✨✨初阶牛✨✨✨ &#x1f43b;强烈推荐优质专栏: &#x1f354;&#x1f35f;&#x1f32f;C的世界(持续更新中) &#x1f43b;推荐专栏1: &#x1f354;&#x1f35f;&#x1f32f;C语言初阶 &#x1f43b;推荐专栏2: &#x1f354;…

C运算符和控制语句

几乎每一个程序都需要进行运算&#xff0c;对数据进行加工处理&#xff0c;否则程序就没有意义了。要进行运算&#xff0c;就需规定可以使用的运算符。 C语言的运算符范围很宽&#xff0c;把除了控制语句和输人输出以外的几乎所有的基本操作都作为运算符处理。 运算符分类1 除…

QToolButton几个小知识点总结

QToolButton设置图标及更改图标大小 QToolButton btn;btn.setIconSize(QSize(35,35));//更改图标大小btn.setIcon(QIcon(":/images/screen.png"));//设置图标QToolButton设置图标和文字显示格式 enum ToolButtonStyle {ToolButtonIconOnly, //只显示图标&#xff08;…

正太分布核函数

正太分布概率密度推导&#xff1a; 设 I ∫ − ∞ ∞ 1 2 π e − x 2 2 d x I \int _{-\infty}^{\infty}\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}dx I∫−∞∞​2π ​1​e−2x2​dx 则&#xff1a; I 2 ∫ − ∞ ∞ 1 2 π e − x 2 2 d x ∫ − ∞ ∞ 1 2 π e −…

likeadmin和fastapi的bug

以下内容写于2023年8月11日 bug 1 请求体 - 多个参数 - FastAPI (tiangolo.com)中“请求体中的单一值”处&#xff0c;选python3.6&#xff0c;接口示例代码是 from typing import Unionfrom fastapi import Body, FastAPI from pydantic import BaseModel from typing_exte…