看完了这个之后划分数据集,训练自己的数据集。-CSDN博客
我再详细说一下自己标注的文件放在什么位置
我发的文件里有这几个文件
在dataset里面有
自己的数据集分为,图片部分和标注文件部分
打开VOCdevkit文件夹
里面有三个文件夹
自己的图片的话,放在JPEGImages
标注的文件:如果是xml格式的话,放在Annotations里,如果是txt格式的话,放在txt里,
我说明一下,比如我有100张图,我对这些图片进行标注了,那么对应的标注文件数量也应该是100个的,大家检查一下,看看自己有没有漏标的之类的东西。
这些文件放在对应的文件夹之后,就可以开始划分了
举个例子
现在我已经把我的图片放在了JPEGImages文件夹里面
如果我的标注文件格式是xml的话,我把标注文件放在Annotations里面
看一下自己图片的格式,去设置xml2txt.py里的参数
看看自己的图片是说明格式的,选择对应的格式
按住shift+鼠标右键点dataset文件夹,选择在终端中打开
这是进入当前文件位置的终端里了,
激活自己的环境 conda activate 自己的环境名字
输入
python xml2txt.py
这时候就是程序在运行了
最下面的一行会出现
大括号里面的几个就是标注文件里面的类别名称
打开data.yaml
把这几个复制进来
nc后面填的是类别个数,看这里显示了4个名字,我这就填4
接着就是划分数据集了,打开split_data.py
val_sie = 0.1 的意思是验证集占比10%
同理test_size = 0.1就是测试集占比10%
剩余的就是训练集了,就是80%
这里一般都是设置8:1:1
还有就是图片格式了,填自己图片的格式
接着就和刚才操作一样,进入当前文件位置的终端后,进入自己的环境
输入
python split_data.py
运行完成后就会显示
你会发现dataset文件夹里多了两个文件夹,
这就是对应划分的数据集了
如果你的标注格式是txt的话,就和刚才的第二步一样,你划分的类别和数量填在data.yaml文件里就可以了