json格式数据集转换成yolo的txt格式数据集

这个代码是参考了两个博客  我是感觉第一篇博客可能有问题,然后自己做了改进,如果我是错误的或者正确的,请各位评论区说一下,感谢

Json格式的数据集标签转化为有效的txt格式(data_coco)_train.json-CSDN博客

COCO(.json)格式 转换为 YOLO(.txt)格式训练(详细介绍,避坑贴)_json to yolo-CSDN博客

# 处理同一个数据集下多个json文件时,仅运行一次class_txt即可
import json
import os
'''
def convert2(size, box):dw = 1.0 / size[0]dh = 1.0 / size[1]x = (box[0] + box[1]) / 2.0y = (box[2] + box[3]) / 2.0w = box[1] - box[0]h = box[3] - box[2]x = x * dww = w * dwy = y * dhh = h * dhreturn (x, y, w, h)'''
def convert(size, box):dw = 1. / (size[0])dh = 1. / (size[1])x = box[0] + box[2] / 2.0y = box[1] + box[3] / 2.0w = box[2] - box[0]h = box[3] - box[1]# round函数确定(xmin, ymin, xmax, ymax)的小数位数x = x * dwy = y * dhw = w * dwh = h * dhreturn (x, y, w, h)
"存储标签与预测框到txt文件中"
def json_txt(json_path, txt_path):"json_path: 需要处理的json文件的路径""txt_path: 将json文件处理后txt文件存放的文件夹名"# 生成存放json文件的路径if not os.path.exists(txt_path):os.mkdir(txt_path)# 读取json文件with open(json_path, 'r') as f:dict = json.load(f)# 得到images和annotations信息images_value = dict.get("images")  # 得到某个键下对应的值annotations_value = dict.get("annotations")  # 得到某个键下对应的值# 使用images下的图像名的id创建txt文件'''list=[]  # 将文件名存储在list中for i in images_value:open(txt_path + str(i.get("file_name")) + '.txt', 'w')list.append(i.get("id"))for i in images_value:for j in annotations_value:if j.get("image_id") == i.get("id"):# bbox标签归一化处理num = sum(j.get('bbox'))new_list = [round(m / num, 6) for m in j.get('bbox')]  # 保留六位小数with open(txt_path + str(i.get("file_name")) + '.txt', 'a') as file1:  # 写入txt文件中print(j.get("category_id"), new_list[0], new_list[1], new_list[2], new_list[3], file=file1)print("结束")
'''# 将id对应图片的bbox写入txt文件中for i in images_value:for j in annotations_value:if j.get("image_id") == i.get("id"):# bbox标签归一化处理w = i.get("width")h = i.get("height")bbox = j.get('bbox')  # 保留六位小数xmin = bbox[0]xmax = bbox[1]ymin = bbox[2]ymax = bbox[3]b = (float(xmin), float(xmax), float(ymin), float(ymax))new_list = convert((w, h), b)with open(txt_path + str(i.get("file_name"))[:-3] + 'txt', 'a') as file1:  # 写入txt文件中print(j.get("category_id"), str(new_list[0]), str(new_list[1]), str(new_list[2]), str(new_list[3]), file=file1)print("结束")"将id对应的标签存储在class.txt中"
def class_txt(json_path, class_txt_path):"json_path: 需要处理的json文件的路径""txt_path: 将json文件处理后存放所需的txt文件名"# 生成存放json文件的路径with open(json_path, 'r') as f:dict = json.load(f)# 得到categories下对应的信息categories_value = dict.get("categories")  # 得到某个键下对应的值# 将每个类别id与类别写入txt文件中with open(class_txt_path, 'a') as file0:for i in categories_value:print(i.get("id"), i.get('name'), file=file0)print("结束")json_txt("./annotations/val.json", "val_labels/")
#class_txt("./annotations/train.json", "id_categories.txt")

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/61999.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java面试之多线程并发篇

前言 本来想着给自己放松一下,刷刷博客,突然被几道面试题难倒!说一说自己对于 synchronized 关键字的了解?说说自己是怎么使用 synchronized 关键字?什么是线程安全?Vector是一个线程安全类吗?…

Ajax学习笔记,第一节:语法基础

Ajax学习笔记,第一节:语法基础 一、概念 1、什么是Ajax 使用浏览器的 XMLHttpRequest 对象 与服务器通信2、什么是axios Axios是一个基于Promise的JavaScript库,支持在浏览器和Node.js环境中使用。相较于Ajax,Axios提供了更多…

【ONE·基础算法 || 动态规划(二)】

总言 主要内容:编程题举例,熟悉理解动态规划类题型(子数组、子序列问题)。                文章目录 总言5、子数组问题(数组中连续的一段)5.1、最大子数组和(medium)5.1.…

Python人工智能项目报告

一、实践概述 1、实践计划和目的 在现代社会,计算机技术已成为支撑社会发展的核心力量,渗透到生活的各个领域,应关注人类福祉,确保自己的工作成果能够造福社会,同时维护安全、健康的自然环境,设计出具有包…

数据库相关学习杂记-事务

ARIES(基于语义的恢复与隔离算法)是现代数据库理论的基础。提供了解决ACID中A、I、D重要的解决思路。 基础知识 这里先复习一下关于ACID的含义以及数据库隔离级别: ACID的含义 原子性(Atomicity): 一个事务中被视为…

2024 java大厂面试复习总结(一)(持续更新)

10年java程序员,2024年正好35岁,2024年11月公司裁员,记录自己找工作时候复习的一些要点。 java基础 hashCode()与equals()的相关规定 如果两个对象相等,则hashcode一定也是相同的两个对象相等,对两个对象分别调用eq…

Python绘制太极八卦

文章目录 系列目录写在前面技术需求1. 图形绘制库的支持2. 图形绘制功能3. 参数化设计4. 绘制控制5. 数据处理6. 用户界面 完整代码代码分析1. rset() 函数2. offset() 函数3. taiji() 函数4. bagua() 函数5. 绘制过程6. 技术亮点 写在后面 系列目录 序号直达链接爱心系列1Pyth…

mfc100u.dll是什么?分享几种mfc100u.dll丢失的解决方法

mfc100u.dll 是一个动态链接库(DLL)文件,属于 Microsoft Foundation Classes (MFC) 库的一部分。MFC 是微软公司开发的一套用于快速开发 Windows 应用程序的 C 类库。mfc100u.dll 文件包含了 MFC 库中一些常用的函数和类的定义,这…

【JavaEE】Servlet:表白墙

文章目录 一、前端二、前置知识三、代码1、后端2、前端3、总结 四、存入数据库1、引入 mysql 的依赖&#xff0c;mysql 驱动包2、创建数据库数据表3、调整上述后端代码3.1 封装数据库操作&#xff0c;和数据库建立连接3.2 调整后端代码 一、前端 <!DOCTYPE html> <ht…

WebRTC音视频同步原理与实现详解(上)

第一章、RTP时间戳与NTP时间戳 1.1 RTP时间戳 时间戳&#xff0c;用来定义媒体负载数据的采样时刻&#xff0c;从单调线性递增的时钟中获取&#xff0c;时钟的精度由 RTP 负载数据的采样频率决定。 音频和视频的采样频率是不一样的&#xff0c;一般音频的采样频率有 8KHz、…

蓝桥杯每日真题 - 第21天

题目&#xff1a;(空间) 题目描述&#xff08;12届 C&C B组A题&#xff09; 解题思路&#xff1a; 转换单位&#xff1a; 内存总大小为 256MB&#xff0c;换算为字节&#xff1a; 25610241024268,435,456字节 计算每个整数占用空间&#xff1a; 每个 32 位整数占用…

利用Python爬虫获得1688按关键字搜索商品:技术解析

在电商领域&#xff0c;1688作为中国领先的B2B电商平台&#xff0c;其商品搜索功能对于商家来说具有极高的价值。通过获取搜索结果&#xff0c;商家可以更好地了解市场趋势&#xff0c;优化产品标题&#xff0c;提高搜索排名。本文将介绍如何使用Python编写爬虫&#xff0c;以获…

三、计算机视觉_05MTCNN人脸检测

0、人脸识别流程概述 人脸识别流程包括两个主要步骤&#xff1a; Step1&#xff1a;人脸检测&#xff0c;确保我们处理的是正确的人脸区域 Step2&#xff1a;身份识别&#xff0c;确定该人脸的身份 0.1 人脸检测 人脸检测是从图像中定位人脸并抠出人脸区域的过程&#xff…

Python/GoLang/Java 多环境管理工具 pyenv/goenv/jenv

目录 一、Python多环境安装使用pyenv公共环境pyenv虚拟环境 二、GoLang多环境goenv安装使用 三、Java多环境 jenv安装使用 参考 一、Python多环境 安装 git clone https://gitee.com/tekintian/pyenv.git /opt/env/pyenvMacOS修改~/.zshrc&#xff0c;Linux修改~/.bashrc&…

价格分类(神经网络)

# 1.导入依赖包 import timeimport torch import torch.nn as nn import torch.optim as optimfrom torch.utils.data import TensorDataset, DataLoader from sklearn.model_selection import train_test_splitimport numpy as np import pandas as pd import matplotlib.pypl…

视频 | Navicat 17 功能亮点

探索 Navicat 17 的数据库管理与开发功能 本视频&#xff0c;我们将主要从结构设计、数据操作、SQL 开发、数据建模和 BI 这五个方面&#xff0c;介绍 Navicat Premium 17 是如何助力数据库开发和管理人员简单高效地完成数据库工作的。 此外&#xff0c;Navicat 系列还涵盖了广…

「Chromeg谷歌浏览器/Edge浏览器」篡改猴Tempermongkey插件的安装与使用

1. 谷歌浏览器安装及使用流程 1.1 准备篡改猴扩展程序包。 因为谷歌浏览器的扩展商城打不开&#xff0c;所以需要准备一个篡改猴压缩包。 其他浏览器只需打开扩展商城搜索篡改猴即可。 没有压缩包的可以进我主页下载。 也可直接点击下载&#xff1a;Chrome浏览器篡改猴(油猴…

git base 下载$ git clone 失败解决方法

$ git clone https://github.com/hjsdjko/hangkongdingpiao.git Cloning into hangkongdingpiao... fatal: unable to access https://github.com/hjsdjko/hangkongdingpiao.git/: SSL certificate problem: unable to get local issuer certificate 使用git config --global …

STM32F103C8T6实时时钟RTC

目录 前言 一、RTC基本硬件结构 二、Unix时间戳 2.1 unix时间戳定义 2.2 时间戳与日历日期时间的转换 2.3 指针函数使用注意事项 ​三、RTC和BKP硬件结构 四、驱动代码解析 前言 STM32F103C8T6外部低速时钟LSE&#xff08;一般为32.768KHz&#xff09;用的引脚是PC14和PC…

【JavaEE初阶】多线程初阶下部

文章目录 前言一、volatile关键字volatile 能保证内存可见性 二、wait 和 notify2.1 wait()方法2.2 notify()方法2.3 notifyAll()方法2.4 wait 和 sleep 的对比&#xff08;面试题&#xff09; 三、多线程案例单例模式 四、总结-保证线程安全的思路五、对比线程和进程总结 前言…