labelme标注格式的数据集转COCO格式脚本

1. MyEncoder 类
   - 这是一个自定义的 JSON 编码器类,用于处理 NumPy 数据类型。
   - 当将 NumPy 数组或其他 NumPy 数据类型转换为 JSON 格式时,默认的 JSON 编码器无法正确处理。这个自定义的编码器可以解决这个问题。

2. labelme2coco 类
   - 这是执行从 Labelme JSON 格式到 COCO JSON 格式转换的主要类。

  __init__
     - 初始化类实例,传入 Labelme JSON 文件列表和保存 COCO JSON 文件的路径。

    - **data_transfer**:
     - 处理每个 Labelme JSON 文件,提取图像信息、类别信息和标注信息。

   - **image、categorie、annotation**:
     - 分别从 Labelme JSON 文件中提取图像信息、类别信息和标注信息。

   - **getcatid**:
     - 根据标签获取类别 ID。

   - **getbbox、mask2box**:
     - 计算给定点集或掩码的边界框。

   - **polygons_to_mask**:
     - 将多边形转换为掩码。

   - **data2coco**:
     - 将提取的信息组合成 COCO 格式的字典。

   - **save_json**:
     - 将 COCO 格式的字典保存为 JSON 文件。

3. **主代码块**:
   - 从 `D:\\desktop\\2023\\Pigseg\\images` 目录下获取 Labelme JSON 文件列表。
   - 调用 `labelme2coco` 类,将 Labelme JSON 文件转换为 COCO JSON 格式,并保存到 `D:\\desktop\\2023\\Pigseg\\train.json` 路径下。

,这个脚本的主要功能是将 Labelme 标注格式的 JSON 文件转换为 COCO 标注格式的 JSON 文件,以便在 COCO 数据集框架下使用这些标注数据。这种转换对于将Labelme 创建的标注应用于 COCO 数据集相关的计算机视觉任务非常有帮助。
 

# coding=gbk
import argparse
import json
import matplotlib.pyplot as plt
import skimage.io as io
import cv2
import labelme.utils as utils
import numpy as np
import glob
import PIL.Image
import os# import PIL#MyEncoder是一个自定义的 JSON 编码器类,用于处理 NumPy 数据类型。
class MyEncoder(json.JSONEncoder):def default(self, obj):if isinstance(obj, np.integer):return int(obj)elif isinstance(obj, np.floating):return float(obj)elif isinstance(obj, np.ndarray):return obj.tolist()else:return super(MyEncoder, self).default(obj)class labelme2coco(object):def __init__(self, labelme_json=[], save_json_path='./train'):''':param labelme_json: 所有labelme的json文件路径组成的列表:param save_json_path: json保存位置'''self.labelme_json = labelme_jsonself.save_json_path = save_json_pathself.images = []self.categories = []self.annotations = []# self.data_coco = {}self.label = []self.annID = 1self.height = 0self.width = 0self.save_json()def data_transfer(self):for num, json_file in enumerate(self.labelme_json):with open(json_file, 'r') as fp:data = json.load(fp)  # 加载json文件self.images.append(self.image(data, num, json_file))for shapes in data['shapes']:label = shapes['label']if label not in self.label:self.categories.append(self.categorie(label))self.label.append(label)points = shapes['points']  # 这里的point是用rectangle标注得到的,只有两个点,需要转成四个点points.append([points[0][0], points[1][1]])points.append([points[1][0], points[0][1]])self.annotations.append(self.annotation(points, label, num))self.annID += 1def image(self, data, num, json_file):image = {}# img = utils.img_b64_to_arr(data['imageData'])  # 解析原图片数据# img=io.imread(data['imagePath']) # 通过图片路径打开图片print(json_file.replace("json", "jpg").replace("annotations", "images"))imgname = ""if os.path.exists(json_file.replace("json", "png").replace("annotations", "images")):img = cv2.imread(json_file.replace("json", "png").replace("annotations", "images"), 0)imgname = os.path.basename(json_file.replace("json", "png").replace("annotations", "images"))else:img = cv2.imread(json_file.replace("json", "jpg").replace("annotations", "images"), 0)imgname = os.path.basename(json_file.replace("json", "jpg").replace("annotations", "images"))# TODO:这里需要指定好输入图像的尺寸,我的图像一般都是同样大小的,所以我就只取一张图片的size# img = cv2.imread("/Users/surui/CRT/data/1.jpg", 0)height, width = img.shape[:2]image['height'] = heightimage['width'] = widthimage['id'] = num + 1image['file_name'] = imgnameself.height = heightself.width = widthreturn imagedef categorie(self, label):categorie = {}categorie['supercategory'] = 'Cancer'categorie['id'] = len(self.label) + 1  # 0 默认为背景categorie['name'] = labelreturn categoriedef annotation(self, points, label, num):annotation = {}annotation['segmentation'] = [list(np.asarray(points).flatten())]annotation['iscrowd'] = 0annotation['image_id'] = num + 1# annotation['bbox'] = str(self.getbbox(points)) # 使用list保存json文件时报错(不知道为什么)# list(map(int,a[1:-1].split(','))) a=annotation['bbox'] 使用该方式转成listannotation['bbox'] = list(map(float, self.getbbox(points)))annotation['area'] = annotation['bbox'][2] * annotation['bbox'][3]# annotation['category_id'] = self.getcatid(label)annotation['category_id'] = self.getcatid(label)  # 注意,源代码默认为1annotation['id'] = self.annIDreturn annotationdef getcatid(self, label):for categorie in self.categories:if label == categorie['name']:return categorie['id']return 1def getbbox(self, points):# img = np.zeros([self.height,self.width],np.uint8)# cv2.polylines(img, [np.asarray(points)], True, 1, lineType=cv2.LINE_AA)  # 画边界线# cv2.fillPoly(img, [np.asarray(points)], 1)  # 画多边形 内部像素值为1polygons = pointsmask = self.polygons_to_mask([self.height, self.width], polygons)return self.mask2box(mask)def mask2box(self, mask):'''从mask反算出其边框mask:[h,w]  0、1组成的图片1对应对象,只需计算1对应的行列号(左上角行列号,右下角行列号,就可以算出其边框)'''# np.where(mask==1)index = np.argwhere(mask == 1)rows = index[:, 0]clos = index[:, 1]# 解析左上角行列号left_top_r = np.min(rows)  # yleft_top_c = np.min(clos)  # x# 解析右下角行列号right_bottom_r = np.max(rows)right_bottom_c = np.max(clos)# return [(left_top_r,left_top_c),(right_bottom_r,right_bottom_c)]# return [(left_top_c, left_top_r), (right_bottom_c, right_bottom_r)]# return [left_top_c, left_top_r, right_bottom_c, right_bottom_r]  # [x1,y1,x2,y2]return [left_top_c, left_top_r, right_bottom_c - left_top_c,right_bottom_r - left_top_r]  # [x1,y1,w,h] 对应COCO的bbox格式def polygons_to_mask(self, img_shape, polygons):mask = np.zeros(img_shape, dtype=np.uint8)mask = PIL.Image.fromarray(mask)xy = list(map(tuple, polygons))PIL.ImageDraw.Draw(mask).polygon(xy=xy, outline=1, fill=1)mask = np.array(mask, dtype=bool)return maskdef data2coco(self):data_coco = {}data_coco['images'] = self.imagesdata_coco['categories'] = self.categoriesdata_coco['annotations'] = self.annotationsreturn data_cocodef save_json(self):self.data_transfer()self.data_coco = self.data2coco()# 保存json文件json.dump(self.data_coco, open(self.save_json_path, 'w'), indent=4, cls=MyEncoder)  # indent=4 更加美观显示if __name__ == '__main__':labelme_json = glob.glob('/opt/10T/home/asc005/YangMingxiang/DenseCLIP/data/PigsCam1ImagesAndJson/*.json')labelme2coco(labelme_json, '/opt/10T/home/asc005/YangMingxiang/DenseCLIP/data/Pigseg/train.json')

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/19466.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

主备切换大揭秘:保证系统永不停机的秘密

Hello,大家好!我是小米,一个积极活泼、热爱分享技术的小伙伴。今天我们来聊聊一个很重要的主题:分布式分区容错性中的主备切换。无论你是一个经验丰富的开发者,还是刚刚入门的小白,这篇文章都将为你揭开分布式系统的神秘面纱,带你深入了解其中的关键技术。让我们开始吧!…

scripts/Makefile.host 分析

文章目录 1. 目标 $(obj)/fixdep1.1 cmd_host-csingle函数分析: 1 # SPDX-License-Identifier: GPL-2.0 2 # 3 # Building binaries on the host system 4 # Binaries are used during the compilation of the kernel, for example 5 # to preprocess a …

【赠书第26期】AI绘画教程:Midjourney使用方法与技巧从入门到精通

文章目录 前言 1 Midjourney入门指南 1.1 注册与登录 1.2 界面熟悉 1.3 基础操作 2 Midjourney进阶技巧 2.1 描述词优化 2.2 参数调整 2.3 迭代生成 3 Midjourney高级应用 3.1 创意启发 3.2 团队协作 3.3 商业应用 4 总结与展望 5 推荐图书 6 粉丝福利 前言 在…

JS易错点

JavaScript 中的常见易错点包括语法错误、逻辑错误和一些常见的陷阱。以下是一些常见的错误和避免这些错误的建议: 变量声明错误 使用 var 声明变量可能导致变量提升和作用域问题,建议使用 let 和 const。错误示例:var x 10; if (true) {var…

Hibernate的优缺点

Hibernate的优缺点可以归纳如下: 优点: 对象关系映射(ORM): Hibernate提供了强大的对象关系映射功能,允许开发人员以面向对象的方式操作数据库,从而简化了数据库操作,提高了开发效…

污水净化之旅:可视化技术揭秘城市“血液”的循环奥秘

在繁华的都市背后,有一个默默守护着我们的“肾脏”——污水处理厂。它悄无声息地处理着每天产生的污水,确保我们的生活环境洁净美好。但你知道这个“肾脏”是如何工作的吗?今天,就让我们一起走进污水处理的神秘世界,通…

Leetcode:寻找两个正序数组的中位数

题目链接:4. 寻找两个正序数组的中位数 - 力扣(LeetCode) 题目分析 1、当只有一个有序数组时,该数组的中位数会将该数组分为两份:左子数组 和 右子数组 2、当有两个有序数组时, 我们仍然可以通过一条分隔…

上岸极不保护一志愿院校经验。

这个系列会邀请上岸学长学姐进行经验分享~ 今天分享经验的同学上岸了哈尔滨工程大学。并不是对这所院校有什么歧视,只是按照往年择校数据来看,确实不太保护一志愿。大家自行斟酌,有利有弊。 经验分享 学长23年上岸哈尔滨工程大学水声工程学…

Sealos CLI快速部署部署K8s集群

1. Kubernetes基础环境部署 kubernetes有多种部署方式,目前主流的方式有kubeadm、minikube、二进制包 minikube:一个用于快速搭建单节点kubernetes的工具 kubeadm:一个用于快速搭建kubernetes集群的工具 二进制包 :从官网下载每…

社区供稿丨GPT-4o 对实时互动与 RTC 的影响

以下文章来源于共识粉碎机 ,作者AI芋圆子 前面的话: GPT-4o 发布当周,我们的社区伙伴「共识粉碎机」就主办了一场主题为「GPT-4o 对实时互动与 RTC 的影响」讨论会。涉及的话题包括: GPT-4o 如何降低延迟(VAD 模块可…

k8s集群搭建

k8s集群搭建 前期准备 1.关闭selinux 永久关闭selinux sed -i s/enforcing/disabled/g /etc/selinux/config更改后需重启系统 reboot2.关闭防火墙 systemctl stop firewalld && systemctl disable firewalld3.关闭swap内存分区 永久关闭swap分区 echo vm.swapp…

LabVIEW中进行步进电机的位置控制

在LabVIEW中进行步进电机的位置控制,通常涉及以下几个关键步骤:设置硬件、配置通信、编写控制算法和实施反馈控制。以下是一个详细的介绍。 硬件设置 步进电机:选择合适的步进电机,根据负载和应用需求选择适当的步数和转矩。 驱…

FL Studio21.2.8中文版让你的音乐创作如鱼得水

在音乐的世界里,我们都是探索者,追求着无尽的创新和可能性。而在这个过程中,我们往往会遇到各种挑战和困扰。如何快速高效地创作出满意的音乐作品?如何将我们的创意完美地呈现出来?这些问题可能一直困扰着你。今天&…

成都欣丰洪泰文化传媒有限公司助力品牌快速崛起

在当今数字化浪潮汹涌的时代,电商行业作为新经济的代表,正以其独特的魅力和无限的潜力,引领着商业模式的创新与变革。在这个充满机遇与挑战的领域里,成都欣丰洪泰文化传媒有限公司凭借其专业的电商服务能力和前瞻性的战略眼光&…

如何在.htaccess文件创建一个自定义404页面

本周有一个客户,购买Hostease的虚拟主机,询问我们的在线客服,如何在.htaccess文件创建一个自定义404页面?我们为用户提供相关教程,用户很快解决了遇到的问题。在此,我们分享这个操作教程,希望可…

NIFT和BMP批量互相转换(matlab)

前言:最近在做数据集,需要进行NIFT和BMP的批量互相转换。之前都是一张一张转换的,用Image J就能完成,但是最近数据太多了,所以得研究一下如何批量转换。 NIFT和BMP互相转换 NIFT和BMP介绍NIFTBMP 为什么要转换Matlab进…

MVC和MVVM

MVC Model层:用于处理应用程序数据逻辑的部分,通常负责在数据库中存取数据 View(视图)处理数据显示的部分。通常视图是依据模型数据创建的 Controller(控制器)是处理用户交互的部分。通常控制器负责从视…

从零开始学Vue3--环境搭建

1.搭建环境 下载nodejs nodejs下载地址 更新npm npm install -g npm 设置npm源,加快下载速度 npm config set registry https://registry.npmmirror.com 使用脚手架创建项目 npm create vuelatest 根据你的需要选择对应选项 进入新建的项目下载依赖 npm in…

Tasker+SendSilentMail实现钉钉自动打卡

Tasker 允许用户根据自定义的“配置文件”(Profiles),在特定的“背景”(Contexts)下,执行指定的“任务”(Tasks)。以下是关于Tasker的详细介绍: 强大的自定义能力:用户可以根据自己的需求,创建各种配置文件和任务&…

【BUG】流式响应requests得到: ping - 和时间戳

前情提要 运行Langchain-Chatchat项目,使用自定义请求访问API Server流式输出 报错展示 b: ping - 2024-05-22 00:46:04.83252000:00\r\n\r\n报错原因 这通常是由于 Server-Sent Events (SSE) 实现中使用的“心跳”机制,以确保连接保持活跃。一些 SSE…