将YOLO数据集转成COCO格式,单个文件夹转为单个json文件,例如.../images/train转为instance_train.json

写在前面

  • 参考链接:objectdetection-tricks/tricks_4.py
    • 相关视频教学:tricks_4 用于yolov5和v7中的yolo格式转换coco格式的脚本.(如何在v5和v7中输出ap_small,ap_middle,ap_large coco指标)
    • 还可以参考相关的VOC转COCO的方式:damo-yolo/voc2coco.py
  • 代码效果:将数据集转成COCO格式,单个文件夹转为单个json文件,例如…/images/train转为instance_train.json
  • 我的数据集排布
datasets
├─images
│  ├─test
│  ├─train
│  └─val
├─annotations├─test├─train└─val

代码

  • 指定好四个参数即可
    • --root_dir:待转换的图像的路径,例如我传入的是训练集的路径...\images\train
    • --save_dir:保存转换后的json文件的路径,通常都是存放在数据集的annotations子文件下的
    • --classtxt_path:存放类别的文件路径
    • --save_name:转换后的json文件名
import os
import cv2
import json
from tqdm import tqdm
import argparseparser = argparse.ArgumentParser()
parser.add_argument('--root_dir', default=r'F:\A_Publicdatasets\RDD2020-1202\train_valid\RDD2020_together\images\test', type=str, help="root path of images and labels, include ./images and ./labels and classes.txt")
parser.add_argument('--save_dir', type=str, default=r'F:\A_Publicdatasets\RDD2020-1202\train_valid\RDD2020_together\annotations', help="if not split the dataset, give a path to a json file")
parser.add_argument('--classtxt_path', type=str, default=r'G:\pycharmprojects\autodl-yolov7\yolov7-main-biyebase\TXTOCOCO\classes.txt', help="class filepath")
parser.add_argument('--save_name', type=str, default='instances_test.json', help="建议只修改后面的train为val、test等,否则自行改代码")arg = parser.parse_args()def yolo2coco(arg):with open(arg.classtxt_path, 'r') as f: # 获取类别名classes = list(map(lambda x: x.strip(), f.readlines()))indexes = []imagesdir = arg.root_dirfor file in os.listdir(imagesdir):indexes.append(f'{imagesdir}/{file}')   # 绝对路径'''下面这段代码是对我自己有用的,看官可将其删除正常的文件排布应该为:-- images--- train--- val--- test而我的是:-- images--- Czech---- train---- val---- test--- India ...--- Japan ...'''# --------------- lwd ---------------- ## cities = ['Czech', 'India', 'Japan']# setdir = arg.save_path.split('_')[-1].split('.')[0] # 'train' 'val' 'test'# indexes = []# for city in cities:#     city_imagedir = f'F:/A_Publicdatasets/RDD2020-1202/train_valid/{city}/images/{setdir}'#     for file in os.listdir(city_imagedir):#         indexes.append(f'{city_imagedir}/{file}')# --------------- lwd ---------------- #dataset = {'categories': [], 'annotations': [], 'images': []}for i, cls in enumerate(classes, 0):dataset['categories'].append({'id': i, 'name': cls, 'supercategory': 'mark'})# 标注的idann_id_cnt = 0for k, index in enumerate(tqdm(indexes)):# 支持 png jpg 格式的图片。txtPath = index.replace('images', 'labels').replace('.jpg', '.txt')# 读取图像的宽和高im = cv2.imread(index)imageFile = index.split('/')[-1]    # img.jpgheight, width, _ = im.shape# 添加图像的信息if not os.path.exists(txtPath):# 如没标签,跳过,只保留图片信息。continuedataset['images'].append({'file_name': imageFile,'id': k,'width': width,'height': height})with open(txtPath, 'r') as fr:labelList = fr.readlines()for label in labelList:label = label.strip().split()x = float(label[1])y = float(label[2])w = float(label[3])h = float(label[4])# convert x,y,w,h to x1,y1,x2,y2H, W, _ = im.shapex1 = (x - w / 2) * Wy1 = (y - h / 2) * Hx2 = (x + w / 2) * Wy2 = (y + h / 2) * H# 标签序号从0开始计算, coco2017数据集标号混乱,不管它了。cls_id = int(label[0])width = max(0, x2 - x1)height = max(0, y2 - y1)dataset['annotations'].append({'area': width * height,'bbox': [x1, y1, width, height],'category_id': cls_id,'id': ann_id_cnt,'image_id': k,'iscrowd': 0,# mask, 矩形是从左上角点按顺时针的四个顶点'segmentation': [[x1, y1, x2, y1, x2, y2, x1, y2]]})ann_id_cnt += 1# 保存结果save_path = os.path.join(arg.save_dir, arg.save_name)with open(save_path, 'w') as f:# json.dump(dataset, f)json_str = json.dumps(dataset)f.write(json_str)print('Save annotation to {}'.format(save_path))if __name__ == "__main__":yolo2coco(arg)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/623755.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

R语言【paleobioDB】——pbdb_reference():通过参数请求获得多条参考文献的基本信息

Package paleobioDB version 0.7.0 paleobioDB 包在2020年已经停止更新,该包依赖PBDB v1 API。 可以选择在Index of /src/contrib/Archive/paleobioDB (r-project.org)下载安装包后,执行本地安装。 Usage pbdb_references (...) Arguments 参数【...】…

MtimeMtimecmp

Mtime: 实时time计数器,可读可写;mtime必须按照一个固定的频率递增;如果count overflow了,则mtime的值需要卷绕;对于32/64的系统来说,mtime的值都是64bits的; 与mtime对应的,还有一…

【架构师成长之领域驱动开发】

架构师成长之路 1. 如何构建高质量应用?2. 三大设计原则?3.DDD妙招4. 最终的改造结果5.模型 项目中的“坏”味道 可维护性差:大量的第三方模块影响核心代码的稳定性可扩展性差:业务逻辑与数据存储相互依赖,无法复用可测…

项目中使用iframe引入html 解决路由错乱问题以及父子组件传值调用方法

iframe与外部之间传值 父组件 <iframeid"iframe"src"luckysheet/index.html"frameborder"0"scrolling"no"style"width: 100%; height: 60vh; border: 0"/>const frame document.getElementById(iframe);frame.onloa…

Python综合练习之图表

文章目录 文件目录如下图标效果timeline_bar_with_graphic.htmltable_base.html articles.jsonarticlesData.pyarticlesEchartsEntity.pyarticlesEntity.py Python学习了约一个月的时间&#xff0c;这是一篇综合练习的文章。主要做的内容是通过封装对象、实现抽象方法生成统计图…

不可预测的市场中,为何有人持续胜出?

为什么经济学家和证券分析师难以预测经济或股价走势&#xff0c;而少数投资大师却能几十年持续复利&#xff1f;这两个问题看似矛盾&#xff0c;既然无法预测&#xff0c;为何又能产生确定性的赚钱结果呢&#xff1f; 有人认为这是因为幸存者偏差。然而&#xff0c;三十年以上连…

优优嗨聚集团:债务逾期,如何应对与解决?

在现代社会&#xff0c;债务问题已成为越来越多人面临的难题。债务逾期不仅会给个人带来巨大的经济压力&#xff0c;还会影响个人信用记录&#xff0c;甚至可能引发法律纠纷。那么&#xff0c;当债务逾期时&#xff0c;我们应该如何应对与解决呢&#xff1f; 一、了解债务情况 …

14.STL 常用算法

14、STL常用算法 概述&#xff1a; 算法主要是由头文件 、、 组成 是所有STL头文件中最大的一个&#xff0c;范围涉及到比较、 交换、查找、遍历操作、复制、修改等等 体积很小&#xff0c;只包括几个在序列上面进行简单数学运算的模板函数 定义了一些模板类,用以声明函数对象…

1.3 面试经典150题 - 删除有序数组中的重复项

删除有序数组中的重复项 class Solution:def removeDuplicates(self, nums: List[int]) -> int:# 处理边界数据if not nums: return 0if len(nums) 1: return 1# 两个指针&#xff0c;一个记录当前有多少个不重复值的个数&#xff0c;一个记录最新遍历到的值count 1tmp …

C# ObjectArx 绘制表格并设置单元格合并

第一行默认是标题&#xff0c;可设置行【RowType】进行设置类型 Document doc Application.DocumentManager.MdiActiveDocument;using (Transaction tr doc.TransactionManager.StartOpenCloseTransaction()){BlockTable bt tr.GetObject(doc.Database.BlockTableId, OpenMo…

GZ075 云计算应用赛题第9套

2023年全国职业院校技能大赛&#xff08;高职组&#xff09; “云计算应用”赛项赛卷9 某企业根据自身业务需求&#xff0c;实施数字化转型&#xff0c;规划和建设数字化平台&#xff0c;平台聚焦“DevOps开发运维一体化”和“数据驱动产品开发”&#xff0c;拟采用开源OpenSt…

Python3 中常用字符串函数介绍

介绍 Python 中有几个与 字符串数据类型相关的内置函数。这些函数让我们能够轻松修改和操作字符串。我们可以将函数视为在代码元素上执行的操作。内置函数是在 Python 编程语言中定义的&#xff0c;并且可以随时供我们使用的函数。 在本教程中&#xff0c;我们将介绍在 Pytho…

导轨式信号隔离变送器比例阀门线性驱动器4-20mA/0-5V/0-10V转0-165mA/0-80mA/0-1A/0-2A/0-4A

主要特性 精度、线性度误差等级&#xff1a; 0.1、0.2、0.5 级4-20mA/0-5V/0-10V 等标准信号输入0~100mA/0~500mA/0~1A/0-5A 等电流信号输出0~1V(max 2A)/0~10V/0-24V(max 5A) 等电压信号输出信号输入/信号输出 3000VDC 隔离辅助电源&#xff1a;12V、15V 或 24V 直流单电源供…

【微服务】日志搜集elasticsearch+kibana+filebeat(单机)

日志搜集eskibanafilebeat&#xff08;单机&#xff09; 日志直接输出到es中&#xff0c;适用于日志量小的项目 基于7.17.16版本 主要配置在于filebeat&#xff0c; es kibana配置改动不大 环境部署 es kibana单机环境部署 略 解压即可 常见报错&#xff0c;百度即可。 记录…

Android 和 IOS 设备唯一ID如何选择

我们在做Android/IOS应用或游戏的时候,或许总会碰到要获取设备唯一id来标识或跟踪玩家。但随着系统安全性的提高,加强用户的隐私安全,获取设备唯一ID变得越来越困难了,下面我们来分析一下,看看哪些还可以满足我们需求,同时,如果您有关于获取设备唯一ID的新发现,欢迎留言…

【Vue监听属性详细介绍】

Vue监听属性详细介绍 1. 监听属性2. watch 属性3. 计算属性&#xff08;Computed Properties&#xff09;4. 侦听器&#xff08;Listeners&#xff09;方法5. .sync 修饰符6. 注意事项 1. 监听属性 在Vue中&#xff0c;监听属性是一个十分重要的特性&#xff0c;它允许你监听和…

揭秘铭文技术: 它如何改变你的数字世界?

在数字世界的演变过程中&#xff0c;区块链技术被广泛认为是一种革命性的创新&#xff0c;为众多行业和领域带来深远的影响。然而&#xff0c;区块链的潜力远不止于此。近年来&#xff0c;一种新兴应用——区块链铭文&#xff0c;正在逐渐引起人们的关注&#xff0c;成为数字世…

修改csdn的字体大小颜色

修改csdn的字体大小颜色 修改csdn的字体大小颜色 修改csdn的字体大小颜色一、设置字体与颜色格式二、修改字体格式三、修改字体颜色 一、设置字体与颜色格式 <font face"华文行楷" colorred size5>本字体是华文行楷&#xff0c;红色&#xff0c;5号大小</fo…

怎样获取power shell 的全部可用命令?2/5(篇幅有点长,分成5份)

在power shell 窗口中&#xff0c;有一个获取全部可用命令的命令&#xff1a;get-command&#xff0c;获取到的命令有1640多个&#xff0c;够学习了吧&#xff1f;那么&#xff0c;power shell 命令有哪些类别呢&#xff1f; PowerShell命令可以分为以下几类&#xff1a; Cmdl…

TS学习笔记二:基础类型及变量声明

本节介绍TypeScript中的基础类型及变量声明方式的说明。TypeScript支持与JavaScript几乎相同的数据类型&#xff0c;此外还提供了实用的枚举类型方便我们使用。基础类型包括&#xff1a;数字&#xff0c;字符串&#xff0c;结构体&#xff0c;布尔值等。 学习视频 TS学习笔记二…