用yoloV5做一个口罩检测的全流程实现

制作数据集

收集相关图片:
可以使用爬虫在百度爬取。爬虫代码如下:

# -*- coding: UTF-8 -*-"""
import requests
import tqdmdef configs(search, page, number):""":param search::param page::param number::return:"""url = 'https://image.baidu.com/search/acjson'params = {"tn": "resultjson_com","logid": "11555092689241190059","ipn": "rj","ct": "201326592","is": "","fp": "result","queryWord": search,"cl": "2","lm": "-1","ie": "utf-8","oe": "utf-8","adpicid": "","st": "-1","z": "","ic": "0","hd": "","latest": "","copyright": "","word": search,"s": "","se": "","tab": "","width": "","height": "","face": "0","istype": "2","qc": "","nc": "1","fr": "","expermode": "","force": "","pn": str(60 * page),"rn": number,"gsm": "1e","1617626956685": ""}return url, paramsdef loadpic(number, page):""":param number::param page::return:"""while (True):if number == 0:breakurl, params = configs(search, page, number)result = requests.get(url, headers=header, params=params).json()url_list = []for data in result['data'][:-1]:url_list.append(data['thumbURL'])for i in range(len(url_list)):getImg(url_list[i], 60 * page + i, path)bar.update(1)number -= 1if number == 0:breakpage += 1print("\nfinish!")def getImg(url, idx, path):""":param url::param idx::param path::return:"""img = requests.get(url, headers=header)file = open(path + 'maintenanceWorker21_' + str(idx + 1) + '.jpg', 'wb')file.write(img.content)file.close()if __name__ == '__main__':search = input("请输入搜索内容:")number = int(input("请输入需求数量:"))path = './car'header = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36'}bar = tqdm.tqdm(total=number)page = 0loadpic(number, page)

安装标注工具labelme

pip insatll lablelme

cmd中输入命令label.exe打开软件。

标注技巧

常用快捷键:D(打开上一张图片),A(打开下一张图片),Ctrl+Z撤销上一个点。
在这里插入图片描述
最好将图片和标记后的json文件放在一个文件夹下。

转换格式

安装labelme2yolo工具:pip install labelme2yolo
通过labelme2yolo --help可以查看用法:
在这里插入图片描述

在cmd中使用如下命令即可以完成转换:

labelme2yolo --json_dir="json文件的路径" --val_size=0.2 --test_size=0 --output_format="bbox"

转换完成就就会在json文件的目录下生成已经划分好的数据集:YOLODataset
在这里插入图片描述

下载yoloV5

github下载yoloV5
在这里插入图片描述
安装相关的库:
在安装前,如果环境以及安装了torch,就将requirements.txt中的torch部分注释掉,如果尚未安装torch,也不要使用国内镜像取安装torch,国内镜像安装的是cpu版本。
在这里插入图片描述

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

下面直接使用命令行来实现训练,就不需要取改文件的路径;

  • 使用YOLOv5的train.py脚本来训练模型,具体命令如下:
python3 train.py --img 640 --batch 16 --epochs 50 --data data.yaml --weights yolov5s.pt --device 0

–img:输入图像大小(这里为640x640)。
–batch:批次大小(这里为16)。
–epochs:训练轮数(这里为50)。
–data:数据集配置文件路径(这里为data.yaml)。
–weights:预训练模型权重文件(这里为yolov5s.pt)。
–device:设备编号(0表示使用第一个GPU)。

  • 使用YOLOv5的val.py脚本来验证模型性能,具体命令如下:
python3 val.py --img 640 --batch 16 --data data.yaml --weights runs/train/exp/weights/best.pt --device 0

–weights:训练好的模型权重文件路径(这里为runs/train/exp/weights/best.pt)

  • 使用YOLOv5的detect.py脚本来进行目标检测,具体命令如下:
python3 detect.py --source ../coco/val2017 --weights runs/train/exp/weights/best.pt --img 640 --conf 0.25 --device 0

–source:待检测的图像或视频文件路径(这里为…/coco/val2017)。
–conf:置信度阈值(这里为0.25)。

将训练好的YOLOv5模型转换为ONNX格式

确保你已经安装了必要的依赖项,尤其是onnx和onnx-simplifier:

pip install onnx onnx-simplifier
  • 使用export.py脚本导出ONNX模型
    在YOLOv5目录中运行以下命令,将训练好的模型转换为ONNX格式:
python3 export.py --weights runs/train/exp/weights/best.pt --img 640 --batch 1 --device 0 --simplify

–weights:训练好的模型权重文件路径(这里为runs/train/exp/weights/best.pt)。
–img:输入图像大小(这里为640x640)。
–batch:批次大小(通常为1)。
–device:设备编号(0表示使用第一个GPU)。
–simplify:使用ONNX Simplifier来简化模型。

加载.onnx代码

import onnxruntime as ort
import numpy as np
import cv2def preprocess(image_path, input_size):# 加载图像img = cv2.imread(image_path)img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)# 调整图像大小img = cv2.resize(img, (input_size, input_size))# 标准化图像img = img / 255.0# 转换为NCHW格式img = np.transpose(img, (2, 0, 1)).astype(np.float32)# 添加批次维度img = np.expand_dims(img, axis=0)return imgdef postprocess(output, conf_threshold=0.5, iou_threshold=0.4):# 假设输出为 (1, num_boxes, 6) 形状,6 包含 (x, y, w, h, conf, class_id)output = output[0]  # 提取第一个批次的输出boxes = output[:, :4]scores = output[:, 4]class_ids = output[:, 5].astype(np.int32)# 过滤低置信度检测mask = scores > conf_thresholdboxes = boxes[mask]scores = scores[mask]class_ids = class_ids[mask]# 非极大值抑制indices = cv2.dnn.NMSBoxes(boxes.tolist(), scores.tolist(), conf_threshold, iou_threshold)boxes = [boxes[i] for i in indices]scores = [scores[i] for i in indices]class_ids = [class_ids[i] for i in indices]return boxes, scores, class_idsdef infer(image_path, model_path, input_size=640):# 加载ONNX模型session = ort.InferenceSession(model_path)# 获取模型输入名称input_name = session.get_inputs()[0].name# 预处理图像img = preprocess(image_path, input_size)# 推理outputs = session.run(None, {input_name: img})# 打印输出内容for i, output in enumerate(outputs):print(f"Output {i}: {output.shape}")# 后处理boxes, scores, class_ids = postprocess(outputs[0])return boxes, scores, class_ids# 推理示例
image_path = './image.jpg'
model_path = './model.onnx'boxes, scores, class_ids = infer(image_path, model_path)# 打印检测结果
for box, score, class_id in zip(boxes, scores, class_ids):print(f"Class ID: {class_id}, Score: {score}, Box: {box}")

在这里插入图片描述

详细解释
  • Class ID:这是检测到的对象的类别ID。在你的例子中,所有检测的对象类别ID为0。你可以根据你训练模型时的类别列表(data.yaml文件中的names字段)来确定类别ID对应的实际对象名称。
  • Score:这是置信度分数,表示模型认为这个检测框中包含对象的概率。在你的例子中,置信度分数分别是0.838, 0.784, 0.700, 0.534。
  • Box:这是检测框的坐标和尺寸。格式为 [中心点x坐标, 中心点y坐标, 宽度, 高度]。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/50621.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

界面控件Telerik UI for WPF 2024 Q2亮点 - 全新的AIPrompt组件

Telerik UI for WPF拥有超过100个控件来创建美观、高性能的桌面应用程序,同时还能快速构建企业级办公WPF应用程序。UI for WPF支持MVVM、触摸等,创建的应用程序可靠且结构良好,非常容易维护,其直观的API将无缝地集成Visual Studio…

C++:类和对象2

1.类的默认成员函数 默认成员函数就是用户没有显示实现编译器会自动生成的成员函数称为默认成员函数。一个类,我们在不写的情况下编译器会默认生成6个默认成员函数,分别是构造函数,析构函数,拷贝构造函数,拷贝赋值运算…

kitti数据集转为bag

下载原始的数据集后,通过终端来运行: unzip 2011_10_03_calib.zip和 unzip 2011_10_03_drive_0047_sync.zip这样这个文件夹才算准备好: 然后去下载kitti2bag工具: pip install kitti2bag然后去2011_10_03文件夹下执行&#xf…

大疆创新2025校招内推

大疆2025校招-内推 一、我们是谁? 大疆研发软件团队,致力于把大疆的硬件设备和大疆用户紧密连接在一起,我们的使命是“让机器有温度,让数据会说话”。 在消费和手持团队,我们的温度来自于激发用户灵感并助力用户创作…

嵌入式C++、STM32、MySQL、GPS、InfluxDB和MQTT协议数据可视化:智能物流管理系统设计思路流程(附代码示例)

目录 项目概述 系统设计 硬件设计 软件设计 系统架构图 代码实现 1. STM32微控制器与传感器代码 代码讲解 2. MQTT Broker设置 3. 数据接收与处理 代码讲解 4. 数据存储与分析 5. 数据分析与可视化 代码讲解 6. 数据可视化 项目总结 项目概述 随着电子商务的快…

深度学习目标检测入门实战

深度学习目标检测入门实战 一、什么是目标检测二、目标检测常用的数据集(开源)(一)VOC数据集(1)背景知识(2)数据集的下载(3)VOC2007 数据集的标注&#xff08…

C++从入门到起飞之——初始化列表类型转换static成员 全方位剖析!

🌈个人主页:秋风起,再归来~🔥系列专栏:C从入门到起飞 🔖克心守己,律己则安 目录 1、初始化列表 2、 类型转换 3. static成员 4、完结散花 1、初始化列表 • 之前我们实现构造函数…

[Unity] ShaderGraph实现DeBuff污染 溶解叠加效果

本篇是在之前的基础上,继续做的功能衍生。 [Unity] ShaderGraph实现Sprite消散及受击变色 完整连连看如下所示:

简洁高效的设备稼动率采集系统(一)

前言: 在自动化生产行业,每个公司都需要一款高效的生产设备,那我们怎么体现出设备的高效呢? 可以采集设备的状态,经过成熟的算法,得到设备的稼动率。设备稼动率是衡量生产设备在一定时间内真正处于生产状态…

Django学习(二)

get请求 练习: views.py def test_method(request):if request.method GET:print(request.GET)# 如果链接中没有参数a会报错print(request.GET[a])# 使用这个方法,当查询不到参数时,不会报错而是返回你设置的值print(request.GET.get(c,n…

ElasticSearch(三)—文档字段参数设置以及元字段

一、 字段参数设置 analyzer: 指定分词器。elasticsearch 是一款支持全文检索的分布式存储系统,对于 text类型的字段,首先会使用分词器进行分词,然后将分词后的词根一个一个存储在倒排索引中,后续查询主要是针对词根…

echarts使用案例

1.配置legend icon 根据点击事件动态更换样式 <template><div ref"chart" style"width: 600px; height: 400px;"></div></template><script>import * as echarts from echarts;export default {name: EchartsExample,data(…

C语言第三天笔记

变量 概念 表面&#xff1a;程序运行过程中取值可以改变的数据 实质&#xff1a;变量其实代表了一块内存区域/单元/空间。变量名可视为该区域的标识。 整个变量分为三部分&#xff1a; 变量名&#xff1a;这个只是变量的一个标识&#xff0c;我们借助变量名来存取数据。 变…

Element快速学习

博客主页&#xff1a;音符犹如代码系列专栏&#xff1a;JavaWeb关注博主&#xff0c;后期持续更新系列文章如果有错误感谢请大家批评指出&#xff0c;及时修改感谢大家点赞&#x1f44d;收藏⭐评论✍ 什么是Element&#xff1f; Element&#xff1a;它是由饿了么团队开发的一个…

盛元广通实验室自动化生物样本库质量控制管理系统

随着我国生物医学研究的不断深入和精准医疗的快速发展&#xff0c;对高质量生物样本的需求日益增长。近年来&#xff0c;我国生物样本库建设取得了显著进展。各级政府、高校和医院纷纷投入资源建设生物样本库&#xff0c;推动了生物样本资源的有效整合和利用。生物样本库的质量…

Footprint Analytics 助力 Core 区块链实现数据效率突破

Core 是一个基于比特币并兼容 EVM 的 Layer 1 区块链&#xff0c;正通过其创新解决方案引革新特币金融。作为首个引入非托管 BTC 质押协议及全球首个发行收益型 BTC ETP 产品的区块链&#xff0c;Core 站在了区块链技术的最前沿。通过利用超过 50% 的比特币挖矿哈希算力&#x…

QEMU源码全解析 —— CPU虚拟化(11)

接前一篇文章: 本文内容参考: 《趣谈Linux操作系统》 —— 刘超,极客时间 《QEMU/KVM》源码解析与应用 —— 李强,机械工业出版社 《深度探索Linux系统虚拟化原理与实现》—— 王柏生 谢广军, 机械工业出版社 特此致谢! 前边几回又再次讲了一下VMX,本回开始讲解VCPU…

vue3 使用Mock

官网: http://mockjs.com/ 安装 npm install mockjs -Dsteps1: main.js 文件引入 import /api/mock.jssteps2: src/api/mock.js import Mock from mockjs import homeApi from ./mockData/home /*** 1.拦截的路径:mock拦截了正常NetWork/网络请求,数据正常响应* 2.方法* …

【苍穹】完美解决由于nginx更换端口号导致无法使用Websocket

一、报错信息 进行到websocket开发的过程中&#xff0c;遇到了前端报错&#xff0c;无法连接的提示&#xff1a; 经过F12排查很明显是服务端和客户端并没有连接成功。这里就涉及到之前的坑&#xff0c;现在需要填上了。 二、报错原因和推导 应该还记得刚开苍穹的第一天配置前…

Java集合——Array、ArrayList、LinkedList

1. ArrayList和Array的区别 1. 大小和自动扩容 Array&#xff1a;创建时指定大小&#xff0c;大小固定。若数组被创建&#xff0c;其大小不能更改 ArrayList&#xff1a;动态数组实现&#xff0c;可以动态增长或缩小。在不断添加元素时&#xff0c;ArrayList会自动进行扩容 …