基于YOLOv8深度学习的钢材表面缺陷检测系统【python源码+Pyqt5界面+数据集+训练代码】目标检测、深度学习实战

《博主简介》

小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。
✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~
👍感谢小伙伴们点赞、关注！

《------往期经典推荐------》

一、AI应用软件开发实战专栏【链接】

项目名称	项目名称
1.【人脸识别与管理系统开发】	2.【车牌识别与自动收费管理系统开发】
3.【手势识别系统开发】	4.【人脸面部活体检测系统开发】
5.【图片风格快速迁移软件开发】	6.【人脸表表情识别系统】
7.【YOLOv8多目标识别与自动标注软件开发】	8.【基于YOLOv8深度学习的行人跌倒检测系统】
9.【基于YOLOv8深度学习的PCB板缺陷检测系统】	10.【基于YOLOv8深度学习的生活垃圾分类目标检测系统】
11.【基于YOLOv8深度学习的安全帽目标检测系统】	12.【基于YOLOv8深度学习的120种犬类检测与识别系统】

二、机器学习实战专栏【链接】，已更新31期，欢迎关注，持续更新中~~
三、深度学习【Pytorch】专栏【链接】

《------正文------》

基本功能演示

在这里插入图片描述

摘要：钢材表面缺陷的检测对于保障产品质量、延长使用寿命以及防止潜在的安全风险至关重要。本文基于YOLOv8深度学习框架，通过1800张图片，训练了一个进行钢材表面缺陷检测的目标检测模型，用于检测热轧钢带的六种典型表面缺陷:即轧制氧化皮，斑块，开裂，点蚀表面，内含物和划痕。并基于此模型开发了一款带UI界面的钢材表面缺陷检测系统，可用于实时检测钢材表面的6种缺陷，更方便进行功能的展示。该系统是基于python与PyQT5开发的，支持图片、视频以及摄像头进行目标检测，并保存检测结果。本文提供了完整的Python代码和使用教程，给感兴趣的小伙伴参考学习，完整的代码资源文件获取方式见文末。

文章目录

基本功能演示
前言
一、软件核心功能介绍及效果演示
- 软件主要功能
- （1）图片检测演示
- （2）视频检测演示
- （3）摄像头检测演示
- （4）保存图片与视频检测结果
二、模型的训练、评估与推理
- 1.YOLOv8的基本原理
- 2. 数据集准备与训练
- 3. 训练结果评估
- 4. 检测结果识别
【获取方式】
结束语

点击跳转至文末《完整相关文件及源码》获取

前言

钢材表面缺陷检测对于保障产品质量、延长使用寿命以及防止潜在的安全风险至关重要。在金属加工和制造业中，及时且准确地检测出表面缺陷，可以避免不合格产品流入市场，从而确保结构的完整性和可靠性，以及产品的美观性和性能标准。此外，缺陷检测能够帮助制造厂商降低废品率，提高材料的利用率，减少经济损失。

钢材表面缺陷检测应用场景广泛，例如在汽车制造、航空航天、船舶制造、建筑、管道和压力容器等行业的钢材质量控制中都极为重要。在轧钢厂，一个自动化的表面缺陷检测系统可以实现在线监控，及时发现生产过程中产生的缺陷，从而快速调整生产参数，提高产品的一次合格率。
在现代制造业中，钢材表面缺陷检测系统还能够与其他工业自动化组件相结合，例如和生产管理系统集成，以提供实时的质量控制反馈，促进智能制造和工业4.0的发展。在售后服务及保养中，系统能够帮助快速诊断运输和使用过程中可能出现的缺陷问题，保证用户的使用安全和产品的长效性能。

博主通过搜集钢材表面缺陷的相关数据图片，根据YOLOv8的目标检测技术，基于python与Pyqt5开发了一款界面简洁的钢材表面缺陷检测系统，可支持图片、视频以及摄像头检测，同时可以将图片或者视频检测结果进行保存。

软件初始界面如下图所示：
在这里插入图片描述
检测界面如下：

一、软件核心功能介绍及效果演示

软件主要功能

1. 可进行热轧钢带的六种典型表面缺陷:即轧制氧化皮，斑块，开裂，点蚀表面，内含物和划痕；
2. 支持图片、视频及摄像头进行检测，同时支持图片的批量检测；
3. 界面可实时显示目标位置、目标总数、置信度、用时等信息;
4. 支持图片或者视频的检测结果保存；

（1）图片检测演示

点击图片图标，选择需要检测的图片，或者点击文件夹图标，选择需要批量检测图片所在的文件夹，操作演示如下：
点击目标下拉框后，可以选定指定目标的结果信息进行显示。 点击保存按钮，会对视频检测结果进行保存，存储路径为：save_data目录下。
注：1.右侧目标位置默认显示置信度最大一个目标位置。所有检测结果均在左下方表格中显示。
单个图片检测操作如下：
在这里插入图片描述

批量图片检测操作如下：
在这里插入图片描述

（2）视频检测演示

点击视频图标，打开选择需要检测的视频，就会自动显示检测结果。点击保存按钮，会对视频检测结果进行保存，存储路径为：save_data目录下。
在这里插入图片描述

（3）摄像头检测演示

点击摄像头图标，可以打开摄像头，可以实时进行检测，再次点击摄像头图标，可关闭摄像头。
在这里插入图片描述

（4）保存图片与视频检测结果

点击保存按钮后，会将当前选择的图片【含批量图片】或者视频的检测结果进行保存。检测的图片与视频结果会存储在save_data目录下。
在这里插入图片描述

二、模型的训练、评估与推理

1.YOLOv8的基本原理

YOLOv8是一种前沿的目标检测技术，它基于先前YOLO版本在目标检测任务上的成功，进一步提升了性能和灵活性。主要的创新点包括一个新的骨干网络、一个新的 Ancher-Free 检测头和一个新的损失函数，可以在从 CPU 到 GPU 的各种硬件平台上运行。
其主要网络结构如下：
在这里插入图片描述

2. 数据集准备与训练

通过网络上搜集关于钢材表面缺陷的各类图片，并使用LabelMe标注工具对每张图片中的目标边框（Bounding Box）及类别进行标注。一共包含1800张图片，其中训练集包含1440张图片，验证集包含360张图片，测试集包含55张图片部分图像及标注如下图所示。该数据库包括1800个灰度图像:六种不同类型的典型表面缺陷，每一类缺陷包含300个样本。六种缺陷分别为：轧制氧化皮，斑块，开裂，点蚀表面，内含物和划痕。对应英文['crazing', 'inclusion', 'patches', 'pitted_surface', 'rolled-in_scale', 'scratches']。
在这里插入图片描述

在这里插入图片描述
图片数据的存放格式如下，在项目目录中新建datasets目录，同时将跌倒检测的图片分为训练集与验证集放入SteelData目录下。

同时我们需要新建一个data.yaml文件，用于存储训练数据的路径及模型需要进行检测的类别。YOLOv8在进行模型训练时，会读取该文件的信息，用于进行模型的训练与验证。data.yaml的具体内容如下：

train: E:\MyCVProgram\SteelDetection\datasets\SteelData\train  # train images (relative to 'path') 128 images
val: E:\MyCVProgram\SteelDetection\datasets\SteelData\val  # val images (relative to 'path') 128 images
test:  # val images (optional)# number of classes
nc: 6# Classes
names: ['crazing', 'inclusion', 'patches', 'pitted_surface', 'rolled-in_scale', 'scratches']

注：train与val后面表示需要训练图片的路径，建议直接写自己文件的绝对路径。
数据准备完成后，通过调用train.py文件进行模型训练，epochs参数用于调整训练的轮数，batch参数用于调整训练的批次大小【根据内存大小调整，最小为1】，代码如下：

# 加载模型
model = YOLO("yolov8n.pt")  # 加载预训练模型
# Use the model
if __name__ == '__main__':# Use the modelresults = model.train(data='datasets/SteelData/data.yaml', epochs=250, batch=4)  # 训练模型# 将模型转为onnx格式# success = model.export(format='onnx')

3. 训练结果评估

在深度学习中，我们通常用损失函数下降的曲线来观察模型训练的情况。YOLOv8在训练时主要包含三个方面的损失：定位损失(box_loss)、分类损失(cls_loss)和动态特征损失（dfl_loss），在训练结束后，可以在runs/目录下找到训练过程及结果文件，如下所示：
在这里插入图片描述
各损失函数作用说明：
定位损失box_loss：预测框与标定框之间的误差（GIoU），越小定位得越准；
分类损失cls_loss：计算锚框与对应的标定分类是否正确，越小分类得越准；
动态特征损失（dfl_loss）：DFLLoss是一种用于回归预测框与目标框之间距离的损失函数。在计算损失时，目标框需要缩放到特征图尺度，即除以相应的stride，并与预测的边界框计算Ciou Loss，同时与预测的anchors中心点到各边的距离计算回归DFLLoss。这个过程是YOLOv8训练流程中的一部分，通过计算DFLLoss可以更准确地调整预测框的位置，提高目标检测的准确性。
本文训练结果如下：
在这里插入图片描述

我们通常用PR曲线来体现精确率和召回率的关系，本文训练结果的PR曲线如下。mAP表示Precision和Recall作为两轴作图后围成的面积，m表示平均，@后面的数表示判定iou为正负样本的阈值。mAP@.5：表示阈值大于0.5的平均mAP，可以看到本文模型6类目标检测的mAP@0.5平均值为0.759，结果还是很不错的。
在这里插入图片描述

4. 检测结果识别

模型训练完成后，我们可以得到一个最佳的训练结果模型best.pt文件，在runs/trian/weights目录下。我们可以使用该文件进行后续的推理检测。
图片检测代码如下：

# 所需加载的模型目录
path = 'models/best.pt'
# 需要检测的图片地址
img_path = "TestFiles/crazing_10.jpg"# 加载预训练模型
# conf	0.25	object confidence threshold for detection
# iou	0.7	intersection over union (IoU) threshold for NMS
model = YOLO(path, task='detect')
# model = YOLO(path, task='detect',conf=0.5)# 检测图片
results = model(img_path)
res = results[0].plot()
res = cv2.resize(res,dsize=None,fx=2,fy=2,interpolation=cv2.INTER_LINEAR)
cv2.imshow("YOLOv8 Detection", res)
cv2.waitKey(0)

执行上述代码后，会将执行的结果直接标注在图片上，结果如下：
在这里插入图片描述
以上便是关于此款钢材表面缺陷检测系统的原理与代码介绍。基于此模型，博主用python与Pyqt5开发了一个带界面的软件系统，即文中第二部分的演示内容，能够很好的支持图片、视频及摄像头进行检测，同时支持检测结果的保存。