前言:所有图像和标签是一一对应,没有标签缺失
写了两个程序来分别检查train文件夹的图像和val文件夹图像是否有缺失标签,如果有,会直接打印出缺失标签的图像名字。也方便以后用户自己添加自己收集的图像数据后,核对图像集和标签集是否一一对应。
1.数据集文件夹(有images文件夹和labels文件夹)
1.1.images文件夹 (有train文件夹和val文件夹,装载图像)
labels文件夹(也是对应的train文件夹和val文件夹,装载标签)
1.1.1.train文件夹(一共有655张照片,一共有8类)
花朵 健康 成熟 果 缺肥 白粉 缺钙 叶斑病
随意选取一些照片进行展示
文件图像开始位置
对应的标签
文件图像结束位置
对应的标签
1.1.2.val文件夹(一共有487张照片,一共也是有8类)
文件图像开始位置
val对应的标签
文件图像结束位置
对应标签展示
对数据集感感兴趣的,可以关注最后一行
import os# 图像文件夹路径
image_folder = './images/val'# 标签文件夹路径
label_folder = './labels/val'# 获取图像文件夹中的所有图像文件名
image_files = os.listdir(image_folder)# 获取标签文件夹中的所有文档文件名
label_files = os.listdir(label_folder)# 提取图像文件名中第一个点之前的名字部分
image_set = {filename.split('.')[0] for filename in image_files}# 提取标签文件名中第一个点之前的名字部分
label_set = {filename.split('.')[0] for filename in label_files}#数据集:https://mbd.pub/o/bread/ZZWWk59u