【ACDC数据集】:预处理ACDC心脏3D MRI影像数据集到VOC数据集格式,nii转为jpg,label转为png

【Segment Anything Model】做分割的专栏链接,欢迎来学习。
【博主微信】cvxiaoyixiao
本专栏为公开数据集的预处理,持续更新中。

文章目录

  • 1️⃣ ACDC数据集介绍
  • 2️⃣ ACDC数据集样例
  • 3️⃣ 预处理ACDC目标
  • 4️⃣ 处理结果样图
  • 5️⃣ 代码
  • 6️⃣ 划分测试集和训练集

1️⃣ ACDC数据集介绍

他是一个多类别的心脏3D MRI影像数据集`,2017年ACDC挑战赛(Automated Cardiac Diagnosis
Challenge)。

原数据集获取,网盘永久有效:
链接:https://pan.baidu.com/s/1F4Xq1crtUSmFcSKxwO4Eaw?pwd=ejfa 提取码:ejfa
–来自百度网盘超级会员V6的分享

2️⃣ ACDC数据集样例

首先夸夸👍 ,ACDC数据集存放格式非常规律👍 ,数据质量非常高👍 清晰了分为3类别。
在这里插入图片描述
training里有100例患者,testing里有50例患者。每个nii的切片个数不同根据勾画的肿瘤。
在这里插入图片描述

Info是媒体信息
patient001_4d.nii.gz是全部的切片,我也不知道从医学上怎么描述,就是这个患者的立体影像,包括没有肿瘤的部分
patient001_frame01.nii.gz是一个时期nii影响的压缩包
patient001_frame01_gt.nii.gz对应patient001_frame01.nii.gz的肿瘤勾画的label的压缩包。用四种像素对应了四个类别包括背景。
patient001_frame12.nii.gz是统一患者另一时期的影像
patient001_frame12_gt.nii.gz是对应的label

总之每个患者都有一个整体影像,还有两个不同成像和对应label。以下是打开之后的影像图。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3️⃣ 预处理ACDC目标

目标:处理ACDC的nii.gz数据集到VOC格式的2d的png图片
VOC格式 这篇文章有讲直达
在这里插入图片描述

例如:将patient001_frame01.nii.gz处理成几张png作为网络image的输入。将patient001_frame01_gt.nii.gz处理成几张png作为label。只处理了training的100例患者,把training当成了整个集合划分了训练测试。并且只关心了frame01第一阶段,第二个阶段的未关心。只关心了留下的部分。够了。
在这里插入图片描述

4️⃣ 处理结果样图

处理结果样图:
img转为jpg label转为png 并且像素为0-3. 0代表背景,1-3代表分类。label图像素太小,这里看不出来,可以看第三张数组图
在这里插入图片描述在这里插入图片描述
在这里插入图片描述

5️⃣ 代码

事先准备好VOC文件夹在这里插入图片描述

"""
处理官网下载的ACDC到网络要求的VOC格式,按需调用
author: cvxiayixiao
Wechat: cvxiayixiao
"""
import os
from os.path import join
import nibabel as nib
import gzip
import shutil
import matplotlib.pyplot as plt
import numpy as npori_ACDC_train_path = './ACDC_challenge_20170617/training'def niigz2nii():"""解压每个患者的01阶段的nii.gz 和 gt.nii.gz 到输入文件夹"ACDC_nii""""input_path = ori_ACDC_train_path# 处理image# target='frame01.nii'# output_path = 'ACDC_nii/images'# 处理gttarget = 'frame01_gt.nii'output_path = 'ACDC_nii/labels'for patient in os.listdir(input_path):# ACDC_challenge_20170617/training/patient001patient_path = join(input_path, patient)for niigz in os.listdir(patient_path):if target in niigz:niigzpath = join(patient_path, niigz)new_nii_path = join(output_path, niigz)shutil.copy(niigzpath, new_nii_path)# niigz2nii()
def convert_nii_to_jpg():'''将ACDC_nii/images中的nii转到VOCjpg中:return:'''image_num = 0nii_path = "./ACDC_nii/images"output_dir = "./VOCdevkit/VOC2007/JPEGImages"for patient in os.listdir(nii_path):patient_path = join(nii_path, patient)for one in os.listdir(patient_path):one_patient_nii_path = join(patient_path, one)# 加载 .nii 文件nii_img = nib.load(one_patient_nii_path)data = nii_img.get_fdata()# 遍历数据的每个切片,并保存为 .png 文件for i in range(data.shape[2]):image_num += 1# 获取当前切片数据slice_data = data[:, :, i]# 创建输出文件路径num = f"{image_num}".zfill(6)output_path = os.path.join(output_dir, f'{patient}_{num}.jpg')# 以灰度图像格式保存切片数据为 .png 文件plt.imsave(output_path, slice_data, cmap='gray')# convert_nii_to_jpg()def convert_nii_to_png():'''将ACDC_nii/labels中的nii转到ACDC_nii/tmp_png_label中此时的像素是原label 中的像素,不是网络中的分类像素,还需要一部转换:return:'''image_num = 0nii_path = "./ACDC_nii/labels"output_dir = "./tmp"for patient in os.listdir(nii_path):patient_path = join(nii_path, patient)for one in os.listdir(patient_path):one_patient_nii_path = join(patient_path, one)# 加载 .nii 文件nii_img = nib.load(one_patient_nii_path)data = nii_img.get_fdata()# 遍历数据的每个切片,并保存为 .png 文件for i in range(data.shape[2]):image_num += 1# 获取当前切片数据slice_data = data[:, :, i]# 创建输出文件路径num = f"{image_num}".zfill(6)output_path = os.path.join(output_dir, f'{patient}_{num}.png')# 以灰度图像格式保存切片数据为 .png 文件plt.imsave(output_path, slice_data, cmap='gray')from PIL import Imagedef turnto255():from PIL import Imagefrom PIL import Imagefor i in os.listdir("tmp"):output_path = os.path.join("./tmp1", i)png_path = join("tmp", i)# 读取图像image = plt.imread(png_path)# 取三个通道的平均值im_gray = np.mean(image, axis=2)im_gray = Image.fromarray((im_gray * 255).astype(np.uint8)).convert("L")# 保存输出图像im_gray.save(output_path)def rename():"""处理好的VOC2007 train和test名称不同,名称不对应不能训练转为对应的,之前的留作副本可以对应原图:return:"""root = "VOCdevkit/VOC2007/SegmentationClass"for i in os.listdir(root):img_old_path = join(root, i)new_png_path = join(root, i[-10:])shutil.copy(img_old_path, new_png_path)# rename()def convert_Class():
Origin_SegmentationClass_path = "./tmp1"
Out_SegmentationClass_path = "./VOCdevkit/VOC2007/SegmentationClass"# -----------------------------------------------------------------------------------#
#   Origin_Point_Value  原始标签对应的像素点值
#   Out_Point_Value     输出标签对应的像素点值
#                       Origin_Point_Value需要与Out_Point_Value一一对应。
#   举例如下,当:
#   Origin_Point_Value = np.array([0, 255]);Out_Point_Value = np.array([0, 1])
#   代表将原始标签中值为0的像素点,调整为0,将原始标签中值为255的像素点,调整为1。
#
#   示例中仅调整了两个像素点值,实际上可以更多个,如:
#   Origin_Point_Value = np.array([0, 128, 255]);Out_Point_Value = np.array([0, 1, 2])
#
#   也可以是数组(当标签值为RGB像素点时),如
#   Origin_Point_Value = np.array([[0, 0, 0], [1, 1, 1]]);Out_Point_Value = np.array([0, 1])
# -----------------------------------------------------------------------------------#
Origin_Point_Value = np.array([63, 127, 191, 255])
# Origin_Point_Value = np.array([0, 0.33333334, 0.6666667, 1])
Out_Point_Value = np.array([0, 1, 2, 3])if not os.path.exists(Out_SegmentationClass_path):os.makedirs(Out_SegmentationClass_path)
png_names = os.listdir(Origin_SegmentationClass_path)
print("正在遍历全部标签。")
for png_name in tqdm(png_names):png = Image.open(os.path.join(Origin_SegmentationClass_path, png_name))w, h = png.sizepng = np.array(png)out_png = np.zeros([h, w])for i in range(len(Origin_Point_Value)):mask = png[:, :] == Origin_Point_Value[i]if len(np.shape(mask)) > 2:mask = mask.all(-1)out_png[mask] = Out_Point_Value[i]x=np.array(out_png, np.uint8)out_png = Image.fromarray(np.array(out_png, np.uint8))out_png.save(os.path.join(Out_SegmentationClass_path, png_name))

6️⃣ 划分测试集和训练集

import os
import randomimport numpy as np
from PIL import Image
from tqdm import tqdm#   修改train_percent用于改变验证集的比例 9:1
trainval_percent    = 1
train_percent       = 0.9
#-------------------------------------------------------#
#   指向VOC数据集所在的文件夹
#   默认指向根目录下的VOC数据集
#-------------------------------------------------------#
VOCdevkit_path      = 'VOCdevkit'if __name__ == "__main__":random.seed(0)print("Generate txt in ImageSets.")segfilepath     = os.path.join(VOCdevkit_path, 'VOC2007/SegmentationClass')saveBasePath    = os.path.join(VOCdevkit_path, 'VOC2007/ImageSets/Segmentation')temp_seg = os.listdir(segfilepath)total_seg = []for seg in temp_seg:if seg.endswith(".png"):total_seg.append(seg)num     = len(total_seg)  list    = range(num)  tv      = int(num*trainval_percent)  tr      = int(tv*train_percent)  trainval= random.sample(list,tv)  train   = random.sample(trainval,tr)  print("train and val size",tv)print("traub suze",tr)ftrainval   = open(os.path.join(saveBasePath,'trainval.txt'), 'w')  ftest       = open(os.path.join(saveBasePath,'test.txt'), 'w')  ftrain      = open(os.path.join(saveBasePath,'train.txt'), 'w')  fval        = open(os.path.join(saveBasePath,'val.txt'), 'w')  for i in list:  name = total_seg[i][:-4]+'\n'  if i in trainval:  ftrainval.write(name)  if i in train:  ftrain.write(name)  else:  fval.write(name)  else:  ftest.write(name)  ftrainval.close()  ftrain.close()  fval.close()  ftest.close()

成功划分
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/86562.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Maven高级---分模块设计,继承(继承关系/版本锁定/自定义属性)

目录 分模块设计 继承与聚合 继承关系 ​案例​ 版本锁定 自定义属性/引用属性 分模块设计 把一个项目拆分成不同的模块 我们可以把原来一个项目包中的东西单独提出来作为一个模块,也是解耦的思想 然后我们可以通过引入依赖的方式将这两个模块引入,如下 继承与聚合 继…

xxe攻击(XML外部实体)

1.定义 XML用于标记电子文件使其具有结构性的标记语言,可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。XML文档结构包括XML声明、DTD文档类型定义(可选)、文档元素。 http://www.w3school.com.…

初识操作系统

目录 一.操作系统的概念 二.正确理解“管理” 三.操作系统对硬件进行管理 四.系统调用接口 五.用户操作接口 一.操作系统的概念 操作系统是一款进行软硬件资源管理的软件 现在我们知道了操作系统的概念了,那么为什么要有操作系统呢? 操作系统将软…

李宏毅hw-9:Explainable ML

——欲速则不达,我已经很幸运了,只要珍惜这份幸运就好了,不必患得患失,慢慢来。 ----查漏补缺: 1.关于这个os.listdir的使用 2.从‘num_文件名.jpg’中提取出数值: 3.slic图像分割标记函数的作用&#xf…

光电探测器怎么选

光电探测器,也称为PD(photodetector) 基本原理是,光信号进入光电探测器转换为电压信号,这个电压信号会很弱,微伏或者毫伏级别。 所以PD分为带放大和不带放大 带放大呢,是因为信号太弱&#xf…

Vue系列(二)之 基础语法上篇【插值,指令,过滤器,计算属性监听属性】以及购物车实现

目录 一. 插值 1.1 文本 1.2 原始HTML 1.3 属性 1.4 表达式 二. 指令 2.1 v-if/v-else-if/v-else指令 2.2 v-show指令 2.3 v-for指令 2.4 下拉框/复选框 2.5 动态参数 三. 过滤器 3.1 局部过滤器基本应用 3.2 局部过滤器串行使用 3.3 局部过滤器传参 3.4 全局过…

QT学习之创建项目

1、添加快捷键到桌面 找到所在安装路径Qt5.14.1\Tools\QtCreator\bin添加至桌面 双击后打开 2、创建项目 点击下一步 再点击下一步 下一步 当前暂时选择32位,之后点击完成 3、进入编辑页面并运行 运行快捷键:CtrlR 运行界面点击按钮: 运行…

单臂路由的详细配置步骤

1、单臂路由概述 单臂路由(router-on-a-stick)是指在路由器的一个接口上通过配置子接口(或“逻辑接口”,并不存在真正物理接口)的方式,实现原来相互隔离的不同VLAN(虚拟局域网)之间…

C++笔记之引用折叠规则

C笔记之引用折叠规则 文章目录 C笔记之引用折叠规则1. 当两个左值引用结合在一起时,它们会折叠成一个左值引用。2. 当一个左值引用和一个右值引用结合在一起时,它们会折叠成一个左值引用。3. 当两个右值引用结合在一起时,它们也会折叠成一个右…

【网络协议】Http-上

Http请求结构: 结构图1: 实验解析请求报文: 1.在Edge浏览器上输入ip地址端口号文件资源,也就是下图中的120.XX.139.29:8888/A/B/c.html 2.我的程序接收到了一个没有有效载荷的http请求(呼应上面的结构图1),如下 GET …

Python机器学习实战-特征重要性分析方法(1):排列重要性(附源码和实现效果)

实现功能 排列重要性 PermutationImportance:该方法会随机排列每个特征的值,然后监控模型性能下降的程度。如果获得了更大的下降意味着特征更重要 实现代码 from sklearn.datasets import load_breast_cancer from sklearn.ensemble import RandomFore…

C语言之字符函数字符串函数篇(2)

目录 字符串查找 strstr strstr的使用 strstr的模拟实现 分析 考虑点 代码 strt strtok的使用 循环改进 错误信息报告 strerror 错误码的错误信息 strerror的使用 perror 字符操作 字符分类函数 字符转化函数 今天我们接着讲字符串函数,也…

balenaEtcher格式化的U盘恢复原来样子

今天用balenaEtcher烧录了U盘,刷机N1盒子openwrt, 刷完机结果发现自己的U盘电脑最后只有167M 想要恢复原来的64G以下是方法,使用win10系统 1、打开命令行cmd(winr打开运行,在其中输入cmd就可以打开); 2…

C++QT day11

绘制时钟 widget.h #ifndef WIDGET_H #define WIDGET_H#include <QWidget> #include <QPaintEvent>//绘制事件类 #include <QDebug>//信息调试类 #include <QPainter>//画家类 #include <QTimer>//定时器类 #include <QTime> #include &…

Android---打开相机拍照

简单实现打开系统系统相机拍一张图片并显示在UI上&#xff0c;适用与个人主页头像的切换。 1. 添加权限。AndroidManifest.xml里添加使用相机的权限。 <uses-permission android:name"android.permission.CAMERA"/> 2. 布局。布局内容比较交单&#xff0c;一…

leetcode21合并两个有序链表

题目&#xff1a; 将两个升序链表合并为一个新的 升序 链表并返回。新链表是通过拼接给定的两个链表的所有节点组成的。 示例 1&#xff1a; 输入&#xff1a;l1 [1,2,4], l2 [1,3,4] 输出&#xff1a;[1,1,2,3,4,4]示例 2&#xff1a; 输入&#xff1a;l1 [], l2 [] 输…

智慧农业农场小程序源码 智慧农场系统源码

智慧农业农场小程序源码 智慧农场系统源码 一、 智慧农场系统的组成 智慧农场系统一般包括传感器、控制器、数据采集与处理平台、应用软件等组成部分。其中, 传感器主要用于采集土壤温度、湿度、光照强度等环境参数,以及作物生长状态、水肥情况等生产信息。控制器则根据传感器…

一个关于 i++ 和 ++i 的面试题打趴了所有人

前言 都说大城市现在不好找工作&#xff0c;可小城市却也不好招人。 我们公司招了挺久都没招到&#xff0c;主管感到有些心累。 我提了点建议&#xff0c;是不是面试问的太深了&#xff0c;在这种小城市&#xff0c;能干活就行。 他说自己问的面试题都很浅显&#xff0c;如果答…

你写过的最蠢的代码是?

&#x1f337;&#x1f341; 博主猫头虎 带您 Go to New World.✨&#x1f341; &#x1f984; 博客首页——猫头虎的博客&#x1f390; &#x1f433;《面试题大全专栏》 文章图文并茂&#x1f995;生动形象&#x1f996;简单易学&#xff01;欢迎大家来踩踩~&#x1f33a; &a…