基于YOLOv7算法和Widerface数据集的高精度实时人脸检测系统(PyTorch+Pyside6+YOLOv7)

摘要:基于YOLOv7算法和Widerface数据集的高精度实时人脸检测系统可用于日常生活中检测与定位人脸目标,此系统可完成对输入图片、视频、文件夹以及摄像头方式的目标检测与识别,同时本系统还支持检测结果可视化与导出。本系统采用YOLOv7目标检测算法来训练数据集,使用Pysdie6框架来搭建桌面页面系统,支持PT、ONNX等模型权重作为系统的预测模型加载。本系统实现的功能包括:模型权重的选择与初始化;检测置信度与后处理IOU阈值的调节;图像的导入、检测、检测结果的可视化与目标统计;视频的导入、检测、检测结果的可视化与目标统计;文件夹的图像批量导入、检测、检测结果的可视化与目标统计;设备摄像头的导入、检测、检测结果的可视化与目标统计;单张图像、视频、摄像的推理用时展示。本博文详细介绍系统的环境搭建过程、整体功能介绍与演示,用时也提供了完整的Python源码和使用教程,适合新入门的朋友参考同时支持二次开发,整个系统的完整代码以及资源文件请转至文末的下载链接来获取。
在这里插入图片描述

YOLOv7算法原理介绍

2022年7月YOLOv7被提出与发布,论文发表在2023的计算机视觉顶级会议CVPR上,在YOLOv3和YOLOv4的官网上均挂上了YOLOv7的链接和说明,这说明YOLOv7已得到了大佬的认可。官方版的YOLOv7相同体量下比YOLOv5精度更高,速度快120%(FPS),比 YOLOX 快180%(FPS),比 Dual-Swin-T 快1200%(FPS),比 ConvNext 快550%(FPS),比 SWIN-L快500%(FPS)。在5FPS到160FPS的范围内,无论是速度或是精度,YOLOv7都超过了目前已知的检测器,并且在GPU V100上进行测试,精度为56.8% AP的模型可达到30 FPS(batch=1)以上的检测速率,与此同时,这是目前唯一一款在如此高精度下仍能超过30FPS的检测器。
论文地址:https://arxiv.org/pdf/2207.02696.pdf
源码地址:https://github.com/WongKinYiu/yolov7
在这里插入图片描述

YOLOv7模型结构

YOLOv7模型的整体结构如下,与YOLOv5相似,整体可分为Input、Backbone、Neck、Head以及Prediction模块。
在这里插入图片描述

本节介绍YOLOv7相关模型里的新的模块:
(1)ReOrg:位于yolov7-w6.yaml文件中
这个模块其实是对输入的信息进行切片操作,与YOLOv2算法的PassThrough层以及YOLOv5(v5.0版本)的Focus操作类似,对输入图层尽可能保持原信息并进行下采样。(这部分代码具体位于models/common.py文件的48行)
(2)多路卷积模块
这部分主要还是大量复用1×1的point Conv和3×3的standard Conv,每个Conv 的输出不仅作为下一个Conv的输入,还会和所有其他的Conv输出进行Concat相连操作,类似于DenseNet里面的操作
(3)SPPCSPC模块
这是一种利用金字塔池化操作和CSP结构得到的模块,依旧包含了大量支路;总的输入会被分成三段进入不同的分支,最中间的分支其实就是金字塔池化操作,左侧分支类似于 depthwise Conv,但是请注意中间的3×3卷积并未进行分组,依旧是标准卷积,右侧则为一个point onv,最后将所有分支输出的信息流进行 concat向量(这部分代码具体位于models/common.py文件的262行)。
(4)RepConv模块
RepVGG是一种基于VGG网络设计的多分支模型,在训练过程中可以通过多分支提升性能,推理可以通过结构重新参数化转换为具有3×3卷积和ReLU的连续直筒型VGG类网络,实现推理速度的加快(这部分代码具体位于models/common.py文件的463行)。
(5)E-ELAN模块
这部分是对多路卷积模块的补充,在更大更深的模型才会用到(yolov7-e6e模型中)。在大多数关于设计高效网络的论文中,主要考虑的因素是参数量、计算量和计算密度。但从内存访存的角度出发出发,还可以分析输入 / 输出信道比、架构的分支数和元素级操作对网络推理速度的影响(shufflenet 论文提出)。在执行模型缩放时还需考虑激活函数,即更多地考虑卷积层输出张量中的元素数量。在大规模 ELAN 中,无论梯度路径长度和计算模块数量如何,都达到了稳定的状态。但如果更多计算模块被无限地堆叠,这种稳定状态可能会被破坏,参数利用率也会降低。作者进一步提出E-ELAN,采用 expand、shuffle、merge cardinality 结构,实现在不破坏原始梯度路径的情况下,提高网络的学习能力(具体在 cfg/training/yolov7-e6e.yaml可看到拆散成单独算子的结构配置)

YOLOv7损失函数

YOLOv7整体和YOLOv5保持一致,分为坐标损失、目标置信度损失(GT就是训练阶段的普通IoU)和分类损失三部分。其中目标置信度损失和分类损失采用BCEWithLogitsLoss(带log的二值交叉熵损失),坐标损失采用CIoU损失。详细参见utils/loss.py 里面的 ComputeLossOTA函数。
IoU_Loss:主要考虑检测框和目标框重叠面积。
GIoU_Loss:在IoU的基础上,解决边界框不重合时的问题。
DIoU_Loss:在IoU和GIoU的基础上,考虑边界框中心点距离的信息。
CIoU_Loss:在DIoU的基础上,考虑边界框宽高比的尺度信息。

系统环境搭建

(1)打开Anaconda Prompt(如果电脑没有anaconda软件,需下载安装)
(2)创建yolo7的conda环境(conda create -n yolo7 python=3.8),并激活yolo7环境(conda activate yolo7)
(3)进入到项目目录(本文演示目录为:E:\Pyside6_yolov7\yolov7)
(4)安装环境依赖包:pip install -r requirements.txt
(5)在环境中输入:python base_camera,py 来打开系统界面
在这里插入图片描述
在这里插入图片描述

系统界面及功能展示

在本博文中将展示设计的软件界面,整体界面设计简洁大方,提供了直观的操作体验,主要功能包括以下几个方面:
模型权重的导入与初始化
检测置信分与后处理IoU阈值的调节
已检测目标的信息展示
检测用时的统计与展示
图像的导入、检测、结果可视化展示及导出
视频的导入、检测、结果可视化展示及导出
文件夹下图像的批量导入、检测、结果可视化展示及导出
摄像头的导入、检测、结果可视化展示及导出
软件的初始界面示例如下图展示:
在这里插入图片描述

模型权重选择与初始化

用户可以通过点击“模型选择”按钮来上传已训练好的模型权重,支持的权重格式包括.pt以及.onnx等。在上传了模型权重后,用户可以单击“模型初始化”按钮,实现对已选择模型权重的初始化信息配置。此外,用户还可以通过调整各种参数,如置信度阈值(Confidence)、检测后处理阈值(IoU)等,来优化检测结果的准确性与速度。在Confidence或IoU下方的输入框中改变值即可同步改变滑动条的进度,同时改变滑动条的进度值也可同步改变输入框的值;Confidence或IOU值的改变将同步到模型里的配置来改变检测置信度阈值与IOU阈值。在完成所有设置后,用户可以轻松地启动检测过程,并查看检测结果的可视化展示。在完成相应的操作后,系统的状态栏(系统右下方)也会显示对应操作的返回结果。
在这里插入图片描述

图像的选择、检测、展示与导出

用户可以通过点击“图像选择”按钮,轻松上传单张图片进行检测与识别。接下来,只需单击“检测”按钮(系统右下角的按钮,详见上面图例),系统便会自动完成目标检测任务。在检测过程中,系统将在“检测用时”栏显示完成检测的推理时间,并在“目标数量”栏显示已检测到的目标数量。用户还可以通过下拉框选择已检测目标,并查看相应的位置信息(即左上角x坐标xmin、左上角y坐标ymin、左下角x坐标xmax以及左下角y坐标ymax)标签值的变化。在检测完成后,系统的右方会显示输入图像的检测结果。
如果用户希望将检测结果保存的话,可以点击“图像结果导出”按钮,然后在弹出的对话框中输入保存文件名及后缀(如1.jpg),即可实现检测结果图像的保存。
当用户点击结束按钮(系统右下角的按钮,详见上面图例)时,系统将退出当前检测任务并刷新界面,清空所有输出信息。此外,用户还可以继续点击“图像选择”或“视频选择”按钮来上传图像或视频进行相应的检测与识别。总之,这个系统为用户提供了一个简单易用的界面,让用户可以快速地完成图像检测任务,并方便地查看与导出检测结果。具体的操作示例如下图所示。
在这里插入图片描述

视频的选择、检测、展示与导出

用户可以点击“视频选择”按钮来上传视频进行检测与识别。接下来,用户只需单击“检测”按钮(系统右下角的按钮,详见上面图例),系统便会自动完成视频目标检测任务。在检测过程中,系统将在“检测用时”栏显示单帧目标检测的推理时间,并在“目标数量”栏显示单帧检测到的目标数量,同时本系统采取进度条来直观地显示当前检测进度。用户还可以通过下拉框选择已检测目标,并查看相应的位置信息(即左上角x坐标xmin、左上角y坐标ymin、左下角x坐标xmax以及左下角y坐标ymax)标签值的变化。在检测完成后,系统的右方会显示输入视频的检测结果。
为了方便用户暂停观察视频检测结果,系统提供了“暂停”按钮(系统右下角的按钮,详见上面图例)。用户点击后系统将会暂停视频检测,此时用户可以通过下拉目标框选择已检测目标的坐标位置信息,然后再点击“继续”按钮(系统右下角的按钮,详见上面图例),即可实现输入视频的继续检测。
如果用户希望将视频检测结果保存,可以点击“视频结果导出”按钮,然后在弹出的对话框中输入保存文件名及后缀(如2.mp4),即可实现检测结果视频的保存。当用户点击“结束”按钮时(系统右下角的按钮,详见上面图例),系统将退出当前视频检测任务并刷新界面,清空所有输出信息。
在这里插入图片描述

文件夹的批量图像导入、检测、展示与导出

用户可以通过点击“文件夹”按钮,轻松完成批量图片的上传。接下来,只需单击“检测”按钮(系统右下角的按钮,详见上面图例),系统便会自动完成目标检测任务对所有文件夹下的图片进行检测。在检测过程中,系统在“检测用时”栏显示完成检测的推理时间,并在“目标数量”栏显示已检测到的目标数量,同时本系统采取进度条来直观地显示当前检测进度。用户还可以通过下拉框选择已检测目标,并查看相应的位置信息(即左上角x坐标xmin、左上角y坐标ymin、左下角x坐标xmax以及左下角y坐标ymax)标签值的变化。在检测完成后,系统的右方会显示输入图像的检测结果。
如果用户希望将检测结果批量保存的话,可以点击“文件夹导出”按钮,然后在弹出的对话框中选择输出文件夹,即可实现批量检测结果图像的保存。当用户点击结束按钮(系统右下角的按钮,详见上面图例)时,系统将退出当前检测任务并刷新界面,清空所有输出信息。具体的操作示例如下图所示。
在这里插入图片描述

摄像头的检测、展示与导出

用户可以通过点击“摄像头打开”按钮来启动摄像头设备(默认开始本机设备的第一个摄像头)。接下来,用户只需单击“检测”按钮(系统右下角的按钮,详见上面图例),系统便会自动完成摄像头目标检测任务。在检测过程中,系统将在“检测用时”栏显示消耗的时间,并在“目标数量”栏显示已检测到的目标数量。用户还可以通过下拉框选择已检测目标,并查看相应的位置信息(即左上角x坐标xmin、左上角y坐标ymin、左下角x坐标xmax以及左下角y坐标ymax)标签值的变化。
如果用户希望将摄像头检测结果保存,可以点击“摄像头导出”按钮,然后在弹出的对话框中输入保存文件名及后缀(如22.mp4),即可实现摄像头检测结果视频的保存。当用户点击“结束”按钮时(系统右下角的按钮,详见上面图例),系统将退出当前摄像头检测任务并刷新界面,清空所有输出信息。总之,这个系统为用户提供了一个简单易用的界面,让他们可以快速地完成摄像头检测任务,并方便地查看与导出检测结果。
在这里插入图片描述

数据集介绍

本系统使用的WiderFace人脸数据集标注了人脸这一个类别,数据集总计16106张图片。该数据集中类别都有大量的旋转和不同的光照条件,有助于训练出更加鲁棒的检测模型。本文实验的人脸检测识别数据集包含训练集12880张图片,验证集3226张图片,选取部分数据部分样本数据集如下图所示。在这里插入图片描述

关键代码解析

本系统采用PyTorch来实现目标检测算法,基于YOLOv7算法进行目标检测。在训练阶段,我们使用了预训练模型作为初始模型进行训练,然后通过多次迭代优化网络参数,以达到更好的检测性能。在训练过程中,我们采用了学习率衰减和数据增强等技术,以增强模型的泛化能力和鲁棒性。为了更好地评估模型的性能,我们在训练集和验证集上进行了大量的实验。通过调整超参数,如学习率、批量大小等,我们最终找到了一个适合本任务的参数设置。同时,为了提高模型的泛化能力,我们还采用了数据增强技术,如随机旋转、缩放、裁剪和颜色变换等,以扩充数据集,同时降低过拟合风险。
在测试阶段,我们使用了训练好的模型来对新的图片和视频进行检测。通过设置阈值,将置信度低于阈值的检测框过滤掉,最终得到检测结果。同时,我们还可以将检测结果保存为图片或视频格式,以便进行后续分析和应用。本系统基于YOLOv7算法,使用PyTorch实现。代码中用到的主要库包括PyTorch、NumPy、OpenCV、Pyside6等。本系统实现的一些关键代码如下图所示。

Pyside6界面设计

PySide6是一款免费的Python跨平台GUI库,它是Python的绑定库,用于开发跨平台GUI应用程序。PySide6是基于Qt5和PyQt5库的下一代Python跨平台GUI库,它为开发人员提供了一个强大的工具集,以构建跨平台的用户界面。PySide6的主要目标是提高性能,简化开发人员的工作,并提供更好的用户体验。PySide6的主要特点包括:
跨平台支持:PySide6支持Windows、MacOS和Linux等多个平台,可以轻松地开发跨平台的GUI应用程序。
高性能:PySide6采用了Qt5和PyQt5库的最新技术,为开发人员提供了更高的性能。
简单易用:PySide6提供了丰富的API和工具,使开发人员能够快速地开发GUI应用程序,而无需过多的编码。
可扩展性:PySide6支持多种GUI组件和控件,可以轻松地扩展和定制应用程序的用户界面。
社区支持:PySide6有一个活跃的社区,提供了丰富的文档和示例代码,帮助开发人员快速上手。

总的来说,PySide6是一款强大的Python跨平台GUI库,它为开发人员提供了一个简单易用的工具集,以构建跨平台的用户界面。PySide6的性能、可扩展性和社区支持使其成为一款非常适合开发人员使用的库。在这里插入图片描述

实验结果与分析

在实验结果与分析部分,我们使用精度和召回率等指标来评估模型的性能,还通过损失曲线和PR曲线来分析训练过程。在训练阶段,我们使用了YOLOv7算法对数据集进行训练,总计训练了300个epochs。从下图可以看出,随着训练次数的增加,模型的训练损失和验证损失都逐渐降低,说明模型不断地学习到更加精准的特征。在训练结束后,我们使用模型在数据集的验证集上进行了评估,得到了以下结果。
在这里插入图片描述

下图展示了我们训练的YOLOv7模型在验证集上的PR曲线,从图中可以看出,模型取得了较高的召回率和精确率,整体表现良好。
在这里插入图片描述

综上,本博文训练得到的YOLOv7模型在数据集上表现良好,具有较高的检测精度和鲁棒性,可以在实际场景中应用。另外本博主对整个系统进行了详细测试,最终开发出一版流畅的高精度目标检测系统界面,就是本博文演示部分的展示,完整的UI界面、测试图片视频、代码文件等均已打包上传,感兴趣的朋友可以关注我私信获取下载链接。另外本博文的PDF与更多的目标检测识别系统请关注笔者的微信公众号 BestSongC (目前已发布基于YOLOv5算法和YOLOv8算法开发的系统界面,以及目标检测算法改进系列)来获取。

其他基于深度学习的目标检测系统如西红柿、猫狗、山羊、野生目标、烟头、二维码、头盔、交警、野生动物、野外烟雾、人体摔倒识别、红外行人、家禽猪、苹果、推土机、蜜蜂、打电话、鸽子、足球、奶牛、人脸口罩、安全背心、烟雾检测系统等有需要的朋友关注我,从博主其他视频中获取下载链接。

完整项目目录如下所示:

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/690619.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【springboot+vue项目(十五)】基于Oauth2的SSO单点登录(二)vue-element-admin框架改造整合Oauth2.0

Vue-element-admin 是一个基于 Vue.js 和 Element UI 的后台管理系统框架,提供了丰富的组件和功能,可以帮助开发者快速搭建现代化的后台管理系统。 一、基本知识 (一)Vue-element-admin 的主要文件和目录 vue-element-admin/ |…

如何确定分库还是 分表?

分库分表 分库分表使用的场景不一样: 分表因为数据量比较大,导致事务执行缓慢;分库是因为单库的性能无法满足要求。 分片策略 1、垂直拆分 水平拆分 3 范围分片(range) 垂直水平拆分 4 如何解决数据查询问题&a…

【Jvm】性能调优(拓展)Jprofiler如何监控和解决死锁、内存泄露问题

文章目录 Jprofiler简介1.安装及IDEA集成Jprofiler2.如何监控并解决死锁3.如何监控及解决内存泄露(重点)4.总结5.后话 Jprofiler简介 Jprofilers是针对Java开发的性能分析工具(免费试用10天), 可以对Java程序的内存,CPU,线程,GC,锁等进行监控和分析, 1.安装及IDEA集成Jprofil…

车载软件架构 —— Adaptive AUTOSAR软件架构中时间同步、网络管理和软件更新策略

车载软件架构 —— Adaptive AUTOSAR软件架构中时间同步、网络管理和软件更新策略 我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师(Wechat:gongkenan2013)。 老规矩,分享一段喜欢的文字,避免自己成…

解决用IPV6+DDNS访问UNRAID webui周期性失效的问题,smb不能访问的问题

我使用的unraid系统使用ddns(DDNSGO)绑定域名(阿里域名)与主机的ipv6地址进行远程访问,unraid是6.12.8。 遇到的问题是,配置当时是没问题的,但是过几天就会失效,无法通过域名访问we…

Maven高级(一)

文章目录 Maven高级(一)1. 分模块设计与开发1.1 介绍1.2 实践1.2.1 分析1.2.2 实现 1.3 总结 2. 继承与聚合2.1 继承2.1.1 继承关系2.1.1.1 思路分析2.1.1.2 实现 2.1.2 版本锁定2.1.2.1 场景2.1.2.2 介绍2.1.2.3 实现2.1.2.4 属性配置 2.2 聚合2.2.1 介…

扫码即可快速协作:草料二维码底部协作面板功能详解

功能介绍 在二维码上添加 底部协作面板 功能后 ,扫码后不仅可以阅读设备信息、产品资料等基本信息,还可以在二维码底部输入内容评论并他人快速协作,支持添加图文、语言、手写签名等操作。 底部协作面板是提供给组织内部成员快速协作的功能&…

《汇编语言》- 读书笔记 - 第10章-CALL 和 RET 指令

《汇编语言》- 读书笔记 - 第10章-CALL 和 RET 指令 10.1 ret 和 retf检测点 10.1 10.2 call 指令10.3 依据位移进行转移的 call 指令检测点 10.2 10.4 转移的目的地址在指令中的 call 指令检测点 10.3 10.5 转移地址在寄存器中的 call 指令10.6 转移地址在内存中的 call 指令检…

数据模型概念

一、概念 (1) 定义 在数据库系统中针对不同的使用对象和应用目的,采用不同的数据模型。根据模型的应用的不同目的,可以将这些模型划分为两类: (2) 分类 A:概念数据模型 它也称信息模型它是按用户的观点(观念世界&…

JVM(2)实战篇

1 内存调优 1.1 内存溢出和内存泄漏 内存泄漏(memory leak):在Java中如果不再使用一个对象,但是该对象依然在GC ROOT的引用链上,这个对象就不会被垃圾回收器回收,这种情况就称之为内存泄漏。 内存泄漏绝…

单调队列和优先队列

本篇记录下一下关于单调队列和优先队列(堆)的方法以及解题思路. 文章目录 一. 单调队列1. 绝对差不超过限制得最长连续子数组2. 跳跃游戏 VI3. 设计自助结算系统4. 和至少为k的最短子数组5. 满足不等式的最大值 二. 优先队列1. 最后一块石头的重量2. 数据…

十二:枚举与注解

文章目录 01、枚举类的使用1.1、枚举类的理解1.2、自定义枚举类1.3、使用enum关键字定义枚举类1.4、Enum类中的常用方法1.5、使用enum关键字定义的枚举类实现接口 02、注解的使用2.1、注解的理解2.3、如何自定义注解2.4、jdk中4个基本的元注解的使用12.5、jdk中4个基本的元注解…

uniapp 适配鸿蒙next调研

1.官方的一些回答 DCloud有资源第一时间得到鸿蒙无apk手机的上市计划。我们和华为保持着紧密沟通,会把握好节奏,不用担心。大家可以观察一个信号,等微信的鸿蒙next版敲定了,鸿蒙无apk手机就可以明确上市计划了。鸿蒙的开发语言是a…

数据结构:动态内存分配+内存分区+宏+结构体

一、作业 1.定义一个学生结构体&#xff0c;包含结构体成员&#xff1a;身高&#xff0c;姓名&#xff0c;成绩&#xff1b;定义一个结构体数组有7个成员&#xff0c;要求终端输入结构体成员的值&#xff0c;根据学生成绩&#xff0c;进行冒泡排序。 #include <stdio.h>…

UE蓝图 Cast节点和源码

系列文章目录 UE蓝图 Cast节点和源码 文章目录 系列文章目录Cast节点功能一、Cast节点用法二、Cast节点使用场景三、Cast节点实现步骤四、Cast节点源码 Cast节点功能 在Unreal Engine&#xff08;UE&#xff09;中&#xff0c;Cast节点是一种蓝图系统中的节点&#xff0c;用于…

【性能测试入门必看】性能测试理论知识

一、性能测试理论知识 1、常用的七种性能测试方法 (1) 后端性能测试&#xff1a;其实&#xff0c;你平时听到的性能测试&#xff0c;大多数情况下指的是后端性能测试&#xff0c;也就是服务器端性能测试。后端性能测试&#xff0c;是通过性能测试工具模拟大量的并发用户请求&…

linux系统Grafana关联zabbix显示

Grafana关联zabbix 服务器下载浏览器配置开启zabbix插件配置zabbix数据源可视化Zabbix数据 服务器下载 grafana-cli plugins list-remote grafana-cli plugins list-remote|grep -i zabbix grafana-cli plugins install alexanderzobnin-zabbix-appsystemctl restart grafana-…

HBase 进阶

参考来源: B站尚硅谷HBase2.x 目录 Master 架构RegionServer 架构写流程MemStore Flush读流程HFile 结构读流程合并读取数据优化 StoreFile CompactionRegion Split预分区&#xff08;自定义分区&#xff09;系统拆分 Master 架构 Master详细架构 1&#xff09;Meta 表格介…

Vue | (一)Vue核心(上) | 尚硅谷Vue2.0+Vue3.0全套教程

文章目录 &#x1f4da;Vue简介&#x1f4da;初识Vue&#x1f4da;模板语法&#x1f4da;数据绑定&#x1f4da;MVVM模型&#x1f4da;数据代理&#x1f407;回顾Object.defineproperty方法&#x1f407;何为数据代理&#x1f407;Vue中的数据代理 &#x1f4da;事件处理&#…

基于java的眼镜店仓库管理系统

源码获取&#xff0c;加V&#xff1a;qq2056908377 摘要&#xff1a; 随着电子商务的兴起&#xff0c;越来越多的商家选择在线销售他们的产品。眼镜店作为零售业的一种&#xff0c;也不例外。随着市场需求的不断增加&#xff0c;眼镜店需要更加高效的管理他们的仓库和库存&…