YOLO学习中的琐碎知识点

目录

一、导入的库

二、名词介绍

(1)pytorch张量

(2)边界框(bounding box)

三、pycharm操作

(1)参数设置

四、文件认识

五、YOLO如何训练自己的模型


一、导入的库

import torch

这行代码导入PyTorch库。

简单的说:PyTorch库是一个流行的深度学习框架,是一个基于Torch的Python开源机器学习库,用于自然语言处理等应用程序。

        Torch是一个有大量机器学习算法支持的科学计算框架,是一个与Numpy类似的张量(Tensor)操作库。

        对于PyTorch,通过反向求导技术,可以让你零延迟地任意改变神经网络的行为,而且其实现速度快。正是这一灵活性是PyTorch对比TensorFlow的最大优势。

优点:支持GPU;灵活,支持动态神经网络;底层代码易于理解;命令式体验;自定义扩展。

缺点:全面性处于劣势,目前PyTorch还不支持快速傅里叶、沿维翻转张量和检查无穷与非数值张量;针对移动端、嵌入式部署以及高性能服务器端的部署其性能表现有待提升;其次因为这个框架较新,使得他的社区没有那么强大,在文档方面其C库大多数没有文档。

pytorch简介和准备知识 - 夷则july的文章 - 知乎pytorch简介和准备知识 - 知乎

import cv2

这行代码导入OpenCV库,这是一个计算机视觉库,用于图像和视频处理。

import numpy as np

这行代码导入NumPy库,这是一个Python中用于科学计算的库,它提供了数组和矩阵的支持。

import time

这行代码导入time库,这是Python中用于测量时间的基本库之一。

import torchvision

这行代码导入torchvision库,这是PyTorch中专门用于计算机视觉任务的库,提供了一些常用的数据集、模型和预处理函数等。

from torchvision import transforms

这行代码从torchvision库中导入transforms模块,这个模块包含了一些常用的图像预处理函数,例如缩放、裁剪、旋转和标准化等。

二、名词介绍

(1)pytorch张量

        PyTorch张量是PyTorch中的核心数据结构,类似于多维数组。它们可以用来存储和操作数据,支持各种数学运算、线性代数操作和神经网络计算等。

        PyTorch张量类似于NumPy的多维数组,但是提供了额外的功能和优化,使其适用于深度学习任务。与NumPy数组相比,PyTorch张量还具有以下特点:

1. GPU加速:PyTorch张量可以在GPU上进行计算,通过将张量移动到GPU内存中,可以利用GPU的并行计算能力加速运算。

2. 自动求导:PyTorch张量可以自动跟踪和计算梯度。这对于使用梯度下降等优化算法来训练神经网络非常有用。

3. 动态计算图:PyTorch使用动态计算图,在每次前向传播时构建图形,从而允许更灵活的模型定义和控制流程。

4. 张量类型:PyTorch提供了不同类型的张量,如浮点型张量(torch.FloatTensor)、整数型张量(torch.LongTensor)和布尔型张量(torch.BoolTensor),以满足不同的需求。

通过使用PyTorch张量可以方便地进行各种数值计算、创建神经网络模型并进行训练。

(2)边界框(bounding box)

        边界框(bounding box)是指在图像或视频中标记物体位置的矩形框,通常用一组坐标表示。边界框可以用来描述目标物体的位置、大小和形状等信息。

        在计算机视觉领域,边界框是非常常见的一种数据结构,经常被用于目标检测、物体跟踪、人脸识别、姿态估计等任务中。例如,在目标检测中,我们需要从一张图像中找出所有的目标物体,并准确地框定它们的位置和大小。这时就需要使用边界框来描述每个目标物体的位置和尺寸。在物体跟踪中,我们需要不断地跟踪一个特定的物体,这时也需要使用边界框来描述物体的位置和大小。

三、pycharm操作

(1)参数设置

四、文件认识

instance_train.json是COCO数据集中的一个注释文件,其中包含了每张图片中所有物体的位置、类别、是否遮挡等信息。这些信息可以用于物体检测、语义分割等任务的训练和评估。

person_keypoints_train.json是COCO数据集中的另一个注释文件,它专门标注了人体关键点的位置信息,用于训练和评估人体姿态估计和动作识别等任务。

captions_val.json是COCO数据集中用于验证集的图像描述注释文件。它包含了每张图像的唯一标识符和对应的图像描述。每个图像通常会有多个描述,每个描述都是对该图像内容的自然语言描述。

captions:为图像描述的标注文件

instances:为目标检测与实例分割的标注文件

person_keypoints:为人体关键点检测的标注文件

注意:这些文件是自己下载的

推荐:COCO数据集(目标检测任务json文件内容总结) - Fangzh的文章 - 知乎
https://zhuanlan.zhihu.com/p/309549190

COCO数据集(.json)训练格式转换成YOLO格式(.txt)

推荐:http://t.csdnimg.cn/he7yq

五、YOLO如何训练自己的模型

推荐文章:http://t.csdnimg.cn/gT8vB

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/701218.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[已解决]npm淘宝镜像最新官方指引(2023.08.31)

最新的配置淘宝镜像的淘宝官方提供的方法 npm config set registry https://registry.npmmirror.com原来的 registry.npm.taobao.org 已替换为 registry.npmmirror.com ,当点击 registry.npm.taobao.org 会默认跳转到 registry.npmmirror.com 如果你想将npm的下载…

StarRocks——滴滴OLAP的技术实践与发展方向

原文大佬的这篇StarRocks实践文章整体写的很深入,介绍了StarRocks数仓架构设计、物化视图加速实时看板、全局字典精确去重等内容,这里直接摘抄下来用作学习和知识沉淀。 目录 一、背景介绍 1.1 滴滴OLAP的发展历程 1.2 OLAP引擎存在的痛点 1.2.1 运维…

【DDD】学习笔记-领域模型与数据模型

领域模型与数据模型 领域驱动的设计模型最重要的概念就是聚合,同时,聚合还要受到限界上下文边界的控制。Eric Evans 之所以要引入限界上下文,其中一个重要原因就是因为我们“无法维护一个涵盖整个企业的统一模型”,于是需要限界上…

[深度学习]yolov9+bytetrack+pyqt5实现目标追踪

【简介】 目标追踪简介 目标追踪是计算机视觉领域中的一个热门研究方向,它涉及到从视频序列中实时地、准确地跟踪目标对象的位置和运动轨迹。随着深度学习技术的快速发展,基于深度学习的目标追踪方法逐渐展现出强大的性能。其中,YOLOv9&…

Arduino中安装ESP32网络抽风无法下载 暴力解决办法 python

不知道什么仙人设计的arduino连接网络部分,死活下不下来。(真的沙口,第一次看到这么抽风的下载口) 操作 给爷惹火了我踏马解析json选zip直接全部下下来 把这个大家的开发板管理地址下下来跟后面python放在同一目录下&#xff0c…

Android LinearLayout 如何让子元素靠下居中对齐 center bottom

Android LinearLayout 如何让子元素靠下居中对齐 center bottom 首先你需要知道两个知识点: android:layout_gravity 指定的是当前元素在父元素中的位置android:gravity 指定的是当前元素子元素的排布位置 比如: 有这么一个布局,我需要让…

OD(10)之Mermaid甘特图(Gantt diagrams)使用详解.md

OD(8)之Mermaid甘特图(Gantt diagrams)使用详解 Author: Once Day Date: 2024年2月24日 漫漫长路才刚刚开始… 全系列文章可参考专栏: Linux实践记录_Once_day的博客-CSDN博客 参考文章: 关于 Mermaid | Mermaid 中文网 (nodejs.cn)Mermaid | Diagramming and charting to…

OpenCV Mat实例详解 六

本文将接着OpenCV Mat实例详解继续介绍OpenCV Mat类的操作符及公有成员函数。 Mat & operator Mat & operator (const Mat &m) 将一个Mat对象赋值个另一个Mat对象。 Mat & operator (const MatExpr &expr) 将一个Mat表达式值赋值给Mat对象 Mat & op…

备考2024年汉字小达人:历年考题练一练-18道选择题

今天为大家分享汉字小达人的备考学习资源,通过参加没有报名费、人人可参加的汉字小达人比赛,激发孩子学习语文的兴趣,并且提升语文学习成绩。 汉字小达人的两轮比赛(区级自由报名活动、市级活动)的选择题主要有六种题型…

Mac安装Appium

一、环境依赖 一、JDK环境二、Android-SDK环境(android自动化)三、Homebrew环境四、Nodejs 安装cnpm 五、安装appium六、安装appium-doctor来确认安装环境是否完成七、安装相关依赖 二、重头大戏, 配置wda(WebDriverAgent&#x…

华为---RSTP(三)---P/A机制及RSTP的生成树形成过程

目录 1. P/A机制简介 1.1 P/A机制的作用 1.2 P/A协商的前提条件 1.3 RSTP选举思路 2. P/A协商过程 3. 举例说明RSTP的生成树形成过程 3.1 示例环境要求 3.2 RSTP的生成树形成过程 3.2.1 SW和SW1之间链路上抓包分析 3.2.2 SW和SW2之间链路上抓包分析 3.2.3 SW1和SW2之…

实现外网手机或者电脑随时随地远程访问家里的电脑主机(linux为例)

文章目录 一、背景概要二、安装配置花生壳软件(linux版本)三、手机端(外网)验证连接四、安装ubuntu20server版系统遇到的问题记录 一、背景概要 由于经常在遇到某些问题的时候,针对某一个场景的理解,需要借助于自己的电脑去编译(aosp/linux/qemu)代码查…

5.2.鸿蒙LiteOS-M los_dispatch

目录 一、cortex-m4 los_dispatch.S代码分析坚持就有收获 一、cortex-m4 los_dispatch.S代码分析 .syntax unified #.syntax [unified | divided], 指定arm 汇编语法规则 .arch armv7e-m #指定平台, 与命令行参数-march同样的作用 .fpu fpv4-sp-d16 #指定浮点运算…

苹果分拣检测YOLOV8NANO

苹果分拣,可以检测成熟、切片、损坏、不成熟四种类型,YOLOV8NANO,训练得到PT模型,然后转换成ONNX,OPENCV的DNN调用,支持C,PYTHON 苹果分拣检测YOLOV8NANO,检测四种类型苹果

C++ 学习之函数对象

C++ 函数对象基本概念 在C++中,函数对象(Function Objects)是一种类或结构体,它重载了函数调用运算符operator(),因此可以像函数一样被调用。函数对象有时也被称为仿函数(Functor)。 以下是关于C++函数对象的基本概念: 使用函数对象:函数对象可以像普通函数一样被调…

【Flink精讲】Flink 内存管理

面临的问题 目前, 大数据计算引擎主要用 Java 或是基于 JVM 的编程语言实现的,例如 Apache Hadoop、 Apache Spark、 Apache Drill、 Apache Flink 等。 Java 语言的好处在于程序员不需要太关注底层内存资源的管理,但同样会面临一个问题&…

从零开始学习Netty - 学习笔记 -Netty入门-EventLoop

5.Neety入门 什么是Netty Netty是一个基于Java NIO的异步事件驱动的网络应用框架。它被广泛用于开发高性能、高可靠性的网络通信程序,特别是服务器端和客户端程序。Netty提供了简洁而强大的API,使得开发者能够轻松地构建各种网络应用,包括实…

LiveQing视频点播流媒体RTMP推流服务功能-支持配置开启 HTTPS 服务什么时候需要开启HTTPS服务

LiveQing视频点播流媒体RTMP推流服务功能支持配置开启 HTTPS 服务什么时候需要开启HTTPS服务 1、配置开启HTTPS1.1、准备https证书1.1.1、选择Nginx类型证书下载 1.2、配置 开启 HTTPS1.2.1 web页面配置1.2.2 配置文件配置 2、验证HTTPS服务3、为什么要开启HTTPS3.1、安全性要求…

Mysql运维篇(四) MHA

大佬博文 https://www.cnblogs.com/gomysql/p/3675429.html MySQL 高可用(MHA) - 知乎 一、MHA简介: MHA(Master High Availability)目前在MySQL高可用方面是一个相对成熟的解决方案,它由日本DeNA公司y…

freeswitch 权威指南 --- 高级篇

官网文档:https://developer.signalwire.com/freeswitch/FreeSWITCH-Explained/ 关于 freeswitch 的公开教程:https://zhuanlan.zhihu.com/p/451981734 内容来自 《FreeSWITCH 权威指南》:目录:https://juejin.cn/post/702058079…