PaddleDetection支持的数据格式
- 目前#PaddleDetection支持43种数据格式:coco voc widerface。在这里我们主要说明一下如何使用自定义COCO进行目标检测、实例分割;如何使用自定义VOC数据集进行目标检测。
- 在PaddleDetection新的版本中,我们将数据配置抽离了出来,用户在自定义数据集进行训练的时候,只需要关注在configs/datasets文件中的数据配置文件即可。
1 使用自定义VOC数据集进行目标检测训练
- 当用户使用VOC数据集进行的,只需要对voc.yml进行修改即可实现正常训练。
- 我们提供了一个自定义的VOC数据集,并整理成如图如下图所示的形式。用户在voc.yml文件中修改路径即可。
- dataset_dir: 表示数据集的路径(该路径下保存数据集、标注文件、标签以及训练验证数据集说明txt文件)
- anno_path: 表示训练/验证数据集的说明txt文件路径 (该处填写相对于dataset_dir的相对路径)
- label_list: 表示label的txt文件路径(该处填写相对于dataset_dir的相对路径)
- 在TestDataset的配置中,对于的主要是label_list的路径,确保在测试过程中,有正确的标签
2 使用自定义coco数据集进行目标检测训练
-
当用户使用COOC数据集进行目标检测的时候,只需要对cooc_detection.yml进行修改即可实现正常训练。
-
我们提供了一个自定义的COCO数据集,并整理成如图如下图所示的形式。用户在cooc_detection.yml文件中修改路径即可。
- image_dir: 表示训练/验证图片的路径
- anno_path: 表示训练/验证图片的标注文件的路径
- dataset_dir: 表示数据集的路径(该路径下保存数据集、标签)
- 在TestDataset的配置中,对于的主要是引入标签,这里会抽取val.json文件中标签,确保在测试过程中,有正确的标签
3 使用自定义COCO数据集进行实例分割训练
-
当用户使用COCO数据集进行实例分割的时候,只需要对cooc_instance.yml进行修改即可实现正常训练,基本何目标检测的coco数据集格式基本一致
-
我们提供了一个自定义的COCO数据集,并整理成如图如下图所示的形式。用户在cooc_instance.yml文件中修改路径即可。
- image_dir: 表示训练/验证图片的路径
- anno_path: 表示训练/验证图片的标注文件的路径
- dataset_dir: 表示数据集的路径(该路径下保存数据集、标签)
- 在TestDataset的配置中,对于的主要是引入标签,这里会抽取val.json文件中标签,确保在测试过程中,有正确的标签