1. 前言
之前写了分类和检测任务划分数据集的脚本,三大任务实现了俩,基于强迫症,也实现一下图像分割的划分脚本
分类划分数据:关于图像分类任务中划分数据集,并且生成分类类别的josn字典文件
检测划分数据:关于目标检测中按照比例将数据集随机划分成训练集和测试集
之前写了目标检测的可视化脚本,明天看看要不要把分类和分割的可视化也实现一下,之前的博文里实现过,但都是大项目里的一个环节,看看能不能单独实现一下
这里的脚本和未划分数据的目录在同一路径
2. 完整代码
如下:
import random
import os
import shutil
from tqdm import tqdm# 划分数据函数
def split_data(root, test_rate):images_path = [os.path.join(root, i) for i in os.listdir(root)] # 获取所有图片路径test_split_path = random.sample(images_path, k=int(len(images_path) * test_rate)) # 随机采样测试集# 遍历所有图片for image_path in tqdm(images_path, desc='loading...'):# 获取相应的标注文件,这里需要根据目录、后缀更改mask_path = image_path.replace('images', 'masks')# 划分数据if image_path in test_split_path: # 在测试集shutil.copy(image_path, './data/test/images')shutil.copy(mask_path, './data/test/masks')else:shutil.copy(image_path, './data/train/images')shutil.copy(mask_path, './data/train/masks')if __name__ == '__main__':rawDataSet = './rawDataSet/images' # 原始数据的图片路径if os.path.exists('./data'): # 如果之前有,那么删除shutil.rmtree('./data')os.makedirs('./data/train/images') # 训练集图片os.makedirs('./data/train/masks') # 训练集标签os.makedirs('./data/test/images') # 测试集图片os.makedirs('./data/test/masks') # 测试集标签# 划分数据split_data(root=rawDataSet, test_rate=0.2)
运行过程:这里测试五个数据
运行结果:
3. 注意的点
根据训练图片找到对应mask模板的时候,这里要根据目录更换