yolo数据集合并方法
- 1.数据集容
- 2.数据集合并
1.数据集容
包含训练集、验证集和测试集。
每一个数据集中包含图像文件夹和标签文件夹。
yaml文件中定义了配置参数,包括目标识别的class类别:
2.数据集合并
需要修改labels文件夹下txt文件class信息,根据每个单独数据集的class name 对照合并后数据集的期待class name修改。这里主要提供修改脚本:
#-*- coding:utf-8 -*-
#Used to merge datasets
import os
# 定义文件夹路径
folder_path = "XXX/train/labels"
# 遍历文件夹中的所有文件
for filename in os.listdir(folder_path):if filename.endswith('.txt'): # 确保只处理 txt 文件file_path = os.path.join(folder_path, filename)with open(file_path, 'r') as file:lines = file.readlines()with open(file_path, 'w') as file:for line in lines:if line[0]=='0': # 判断是否是需要修改的类别标号modified_line = '8' + line[1:] # 将第一个字符修改为 'X'file.write(modified_line)else:file.write(line) # 保持不变