【ACDC数据集】:预处理ACDC心脏3D MRI影像数据集到VOC数据集格式,nii转为jpg,label转为png

【Segment Anything Model】做分割的专栏链接,欢迎来学习。
【博主微信】cvxiaoyixiao
本专栏为公开数据集的预处理,持续更新中。

文章目录

  • 1️⃣ ACDC数据集介绍
  • 2️⃣ ACDC数据集样例
  • 3️⃣ 预处理ACDC目标
  • 4️⃣ 处理结果样图
  • 5️⃣ 代码
  • 6️⃣ 划分测试集和训练集

1️⃣ ACDC数据集介绍

他是一个多类别的心脏3D MRI影像数据集`,2017年ACDC挑战赛(Automated Cardiac Diagnosis
Challenge)。

原数据集获取,网盘永久有效:
链接:https://pan.baidu.com/s/1F4Xq1crtUSmFcSKxwO4Eaw?pwd=ejfa 提取码:ejfa
–来自百度网盘超级会员V6的分享

2️⃣ ACDC数据集样例

首先夸夸👍 ,ACDC数据集存放格式非常规律👍 ,数据质量非常高👍 清晰了分为3类别。
在这里插入图片描述
training里有100例患者,testing里有50例患者。每个nii的切片个数不同根据勾画的肿瘤。
在这里插入图片描述

Info是媒体信息
patient001_4d.nii.gz是全部的切片,我也不知道从医学上怎么描述,就是这个患者的立体影像,包括没有肿瘤的部分
patient001_frame01.nii.gz是一个时期nii影响的压缩包
patient001_frame01_gt.nii.gz对应patient001_frame01.nii.gz的肿瘤勾画的label的压缩包。用四种像素对应了四个类别包括背景。
patient001_frame12.nii.gz是统一患者另一时期的影像
patient001_frame12_gt.nii.gz是对应的label

总之每个患者都有一个整体影像,还有两个不同成像和对应label。以下是打开之后的影像图。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3️⃣ 预处理ACDC目标

目标:处理ACDC的nii.gz数据集到VOC格式的2d的png图片
VOC格式 这篇文章有讲直达
在这里插入图片描述

例如:将patient001_frame01.nii.gz处理成几张png作为网络image的输入。将patient001_frame01_gt.nii.gz处理成几张png作为label。只处理了training的100例患者,把training当成了整个集合划分了训练测试。并且只关心了frame01第一阶段,第二个阶段的未关心。只关心了留下的部分。够了。
在这里插入图片描述

4️⃣ 处理结果样图

处理结果样图:
img转为jpg label转为png 并且像素为0-3. 0代表背景,1-3代表分类。label图像素太小,这里看不出来,可以看第三张数组图
在这里插入图片描述在这里插入图片描述
在这里插入图片描述

5️⃣ 代码

事先准备好VOC文件夹在这里插入图片描述

"""
处理官网下载的ACDC到网络要求的VOC格式,按需调用
author: cvxiayixiao
Wechat: cvxiayixiao
"""
import os
from os.path import join
import nibabel as nib
import gzip
import shutil
import matplotlib.pyplot as plt
import numpy as npori_ACDC_train_path = './ACDC_challenge_20170617/training'def niigz2nii():"""解压每个患者的01阶段的nii.gz 和 gt.nii.gz 到输入文件夹"ACDC_nii""""input_path = ori_ACDC_train_path# 处理image# target='frame01.nii'# output_path = 'ACDC_nii/images'# 处理gttarget = 'frame01_gt.nii'output_path = 'ACDC_nii/labels'for patient in os.listdir(input_path):# ACDC_challenge_20170617/training/patient001patient_path = join(input_path, patient)for niigz in os.listdir(patient_path):if target in niigz:niigzpath = join(patient_path, niigz)new_nii_path = join(output_path, niigz)shutil.copy(niigzpath, new_nii_path)# niigz2nii()
def convert_nii_to_jpg():'''将ACDC_nii/images中的nii转到VOCjpg中:return:'''image_num = 0nii_path = "./ACDC_nii/images"output_dir = "./VOCdevkit/VOC2007/JPEGImages"for patient in os.listdir(nii_path):patient_path = join(nii_path, patient)for one in os.listdir(patient_path):one_patient_nii_path = join(patient_path, one)# 加载 .nii 文件nii_img = nib.load(one_patient_nii_path)data = nii_img.get_fdata()# 遍历数据的每个切片,并保存为 .png 文件for i in range(data.shape[2]):image_num += 1# 获取当前切片数据slice_data = data[:, :, i]# 创建输出文件路径num = f"{image_num}".zfill(6)output_path = os.path.join(output_dir, f'{patient}_{num}.jpg')# 以灰度图像格式保存切片数据为 .png 文件plt.imsave(output_path, slice_data, cmap='gray')# convert_nii_to_jpg()def convert_nii_to_png():'''将ACDC_nii/labels中的nii转到ACDC_nii/tmp_png_label中此时的像素是原label 中的像素,不是网络中的分类像素,还需要一部转换:return:'''image_num = 0nii_path = "./ACDC_nii/labels"output_dir = "./tmp"for patient in os.listdir(nii_path):patient_path = join(nii_path, patient)for one in os.listdir(patient_path):one_patient_nii_path = join(patient_path, one)# 加载 .nii 文件nii_img = nib.load(one_patient_nii_path)data = nii_img.get_fdata()# 遍历数据的每个切片,并保存为 .png 文件for i in range(data.shape[2]):image_num += 1# 获取当前切片数据slice_data = data[:, :, i]# 创建输出文件路径num = f"{image_num}".zfill(6)output_path = os.path.join(output_dir, f'{patient}_{num}.png')# 以灰度图像格式保存切片数据为 .png 文件plt.imsave(output_path, slice_data, cmap='gray')from PIL import Imagedef turnto255():from PIL import Imagefrom PIL import Imagefor i in os.listdir("tmp"):output_path = os.path.join("./tmp1", i)png_path = join("tmp", i)# 读取图像image = plt.imread(png_path)# 取三个通道的平均值im_gray = np.mean(image, axis=2)im_gray = Image.fromarray((im_gray * 255).astype(np.uint8)).convert("L")# 保存输出图像im_gray.save(output_path)def rename():"""处理好的VOC2007 train和test名称不同,名称不对应不能训练转为对应的,之前的留作副本可以对应原图:return:"""root = "VOCdevkit/VOC2007/SegmentationClass"for i in os.listdir(root):img_old_path = join(root, i)new_png_path = join(root, i[-10:])shutil.copy(img_old_path, new_png_path)# rename()def convert_Class():
Origin_SegmentationClass_path = "./tmp1"
Out_SegmentationClass_path = "./VOCdevkit/VOC2007/SegmentationClass"# -----------------------------------------------------------------------------------#
#   Origin_Point_Value  原始标签对应的像素点值
#   Out_Point_Value     输出标签对应的像素点值
#                       Origin_Point_Value需要与Out_Point_Value一一对应。
#   举例如下,当:
#   Origin_Point_Value = np.array([0, 255]);Out_Point_Value = np.array([0, 1])
#   代表将原始标签中值为0的像素点,调整为0,将原始标签中值为255的像素点,调整为1。
#
#   示例中仅调整了两个像素点值,实际上可以更多个,如:
#   Origin_Point_Value = np.array([0, 128, 255]);Out_Point_Value = np.array([0, 1, 2])
#
#   也可以是数组(当标签值为RGB像素点时),如
#   Origin_Point_Value = np.array([[0, 0, 0], [1, 1, 1]]);Out_Point_Value = np.array([0, 1])
# -----------------------------------------------------------------------------------#
Origin_Point_Value = np.array([63, 127, 191, 255])
# Origin_Point_Value = np.array([0, 0.33333334, 0.6666667, 1])
Out_Point_Value = np.array([0, 1, 2, 3])if not os.path.exists(Out_SegmentationClass_path):os.makedirs(Out_SegmentationClass_path)
png_names = os.listdir(Origin_SegmentationClass_path)
print("正在遍历全部标签。")
for png_name in tqdm(png_names):png = Image.open(os.path.join(Origin_SegmentationClass_path, png_name))w, h = png.sizepng = np.array(png)out_png = np.zeros([h, w])for i in range(len(Origin_Point_Value)):mask = png[:, :] == Origin_Point_Value[i]if len(np.shape(mask)) > 2:mask = mask.all(-1)out_png[mask] = Out_Point_Value[i]x=np.array(out_png, np.uint8)out_png = Image.fromarray(np.array(out_png, np.uint8))out_png.save(os.path.join(Out_SegmentationClass_path, png_name))

6️⃣ 划分测试集和训练集

import os
import randomimport numpy as np
from PIL import Image
from tqdm import tqdm#   修改train_percent用于改变验证集的比例 9:1
trainval_percent    = 1
train_percent       = 0.9
#-------------------------------------------------------#
#   指向VOC数据集所在的文件夹
#   默认指向根目录下的VOC数据集
#-------------------------------------------------------#
VOCdevkit_path      = 'VOCdevkit'if __name__ == "__main__":random.seed(0)print("Generate txt in ImageSets.")segfilepath     = os.path.join(VOCdevkit_path, 'VOC2007/SegmentationClass')saveBasePath    = os.path.join(VOCdevkit_path, 'VOC2007/ImageSets/Segmentation')temp_seg = os.listdir(segfilepath)total_seg = []for seg in temp_seg:if seg.endswith(".png"):total_seg.append(seg)num     = len(total_seg)  list    = range(num)  tv      = int(num*trainval_percent)  tr      = int(tv*train_percent)  trainval= random.sample(list,tv)  train   = random.sample(trainval,tr)  print("train and val size",tv)print("traub suze",tr)ftrainval   = open(os.path.join(saveBasePath,'trainval.txt'), 'w')  ftest       = open(os.path.join(saveBasePath,'test.txt'), 'w')  ftrain      = open(os.path.join(saveBasePath,'train.txt'), 'w')  fval        = open(os.path.join(saveBasePath,'val.txt'), 'w')  for i in list:  name = total_seg[i][:-4]+'\n'  if i in trainval:  ftrainval.write(name)  if i in train:  ftrain.write(name)  else:  fval.write(name)  else:  ftest.write(name)  ftrainval.close()  ftrain.close()  fval.close()  ftest.close()

成功划分
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/86562.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

十五)Stable Diffusion使用教程:另一个线稿出3D例子

案例:黄金首饰出图 1)线稿,可以进行色阶加深,不易丢失细节; 2)文生图,精确材质、光泽、工艺(抛光、拉丝等)、形状(包括深度等,比如镂空)和渲染方式(3D、素描、线稿等)提示词,负面提示词; 3)seed调-1,让ai随机出图; 4)开启controlnet,上传线稿图,选择cann…

leetcode 2560. 打家劫舍 IV

2560. 打家劫舍 IV 沿街有一排连续的房屋。每间房屋内都藏有一定的现金。现在有一位小偷计划从这些房屋中窃取现金。 由于相邻的房屋装有相互连通的防盗系统,所以小偷 不会窃取相邻的房屋 。 小偷的 窃取能力 定义为他在窃取过程中能从单间房屋中窃取的 最大金额 。…

《Java并发编程实战》第4章-对象的组合

0.概念理解 状态空间:对象与变量所有可能的取值,状态空间越小,就越容易判断线程的状态,final域用得越多,就越能简化对象可能状态的分析过程(不可变对象只有唯一的状态)。 实例封闭:…

Maven高级---分模块设计,继承(继承关系/版本锁定/自定义属性)

目录 分模块设计 继承与聚合 继承关系 ​案例​ 版本锁定 自定义属性/引用属性 分模块设计 把一个项目拆分成不同的模块 我们可以把原来一个项目包中的东西单独提出来作为一个模块,也是解耦的思想 然后我们可以通过引入依赖的方式将这两个模块引入,如下 继承与聚合 继…

xxe攻击(XML外部实体)

1.定义 XML用于标记电子文件使其具有结构性的标记语言,可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。XML文档结构包括XML声明、DTD文档类型定义(可选)、文档元素。 http://www.w3school.com.…

初识操作系统

目录 一.操作系统的概念 二.正确理解“管理” 三.操作系统对硬件进行管理 四.系统调用接口 五.用户操作接口 一.操作系统的概念 操作系统是一款进行软硬件资源管理的软件 现在我们知道了操作系统的概念了,那么为什么要有操作系统呢? 操作系统将软…

李宏毅hw-9:Explainable ML

——欲速则不达,我已经很幸运了,只要珍惜这份幸运就好了,不必患得患失,慢慢来。 ----查漏补缺: 1.关于这个os.listdir的使用 2.从‘num_文件名.jpg’中提取出数值: 3.slic图像分割标记函数的作用&#xf…

光电探测器怎么选

光电探测器,也称为PD(photodetector) 基本原理是,光信号进入光电探测器转换为电压信号,这个电压信号会很弱,微伏或者毫伏级别。 所以PD分为带放大和不带放大 带放大呢,是因为信号太弱&#xf…

Vue系列(二)之 基础语法上篇【插值,指令,过滤器,计算属性监听属性】以及购物车实现

目录 一. 插值 1.1 文本 1.2 原始HTML 1.3 属性 1.4 表达式 二. 指令 2.1 v-if/v-else-if/v-else指令 2.2 v-show指令 2.3 v-for指令 2.4 下拉框/复选框 2.5 动态参数 三. 过滤器 3.1 局部过滤器基本应用 3.2 局部过滤器串行使用 3.3 局部过滤器传参 3.4 全局过…

内存映射的注意事项

1.如果对mmap的返回值(ptr)做操作(ptr),munmap是否能够成功? 可以,但是不建议 2.如果open时O_RDONLY,mmap时prot参数指定PROT READPROT WRITE会怎样? 错误,返回MAP_FAILED open()函数中的权限建议和prot参数的权限保持…

GsonUtils和字符串

文章目录 1、GsonUtils2、String本身,可以加入日志信息3、 Json和Map转换4、Date转为Json字符串5、Json和List<T>转换6、 比较两个JSON字符串的不同7、 字符串填充&#xff1a;生成单据号时填充8、 String.format()的使用9、截断字符串10、splitisNotBlank 和 isNotEmpty…

QT学习之创建项目

1、添加快捷键到桌面 找到所在安装路径Qt5.14.1\Tools\QtCreator\bin添加至桌面 双击后打开 2、创建项目 点击下一步 再点击下一步 下一步 当前暂时选择32位&#xff0c;之后点击完成 3、进入编辑页面并运行 运行快捷键&#xff1a;CtrlR 运行界面点击按钮&#xff1a; 运行…

C# 如何使用windows服务做定时任务

在 C# 中&#xff0c;你可以使用 Windows 服务来创建定时任务。以下是创建定时任务的步骤&#xff1a; 创建一个新的 Windows 服务项目&#xff1a; 打开 Visual Studio。选择 “创建新项目”。在搜索框中搜索 “Windows 服务”。选择 “Windows 服务” 模板&#xff0c;并设置…

单臂路由的详细配置步骤

1、单臂路由概述 单臂路由&#xff08;router-on-a-stick&#xff09;是指在路由器的一个接口上通过配置子接口&#xff08;或“逻辑接口”&#xff0c;并不存在真正物理接口&#xff09;的方式&#xff0c;实现原来相互隔离的不同VLAN&#xff08;虚拟局域网&#xff09;之间…

C++笔记之引用折叠规则

C笔记之引用折叠规则 文章目录 C笔记之引用折叠规则1. 当两个左值引用结合在一起时&#xff0c;它们会折叠成一个左值引用。2. 当一个左值引用和一个右值引用结合在一起时&#xff0c;它们会折叠成一个左值引用。3. 当两个右值引用结合在一起时&#xff0c;它们也会折叠成一个右…

【网络协议】Http-上

Http请求结构&#xff1a; 结构图1&#xff1a; 实验解析请求报文&#xff1a; 1.在Edge浏览器上输入ip地址端口号文件资源&#xff0c;也就是下图中的120.XX.139.29:8888/A/B/c.html 2.我的程序接收到了一个没有有效载荷的http请求(呼应上面的结构图1)&#xff0c;如下 GET …

Python机器学习实战-特征重要性分析方法(1):排列重要性(附源码和实现效果)

实现功能 排列重要性 PermutationImportance&#xff1a;该方法会随机排列每个特征的值&#xff0c;然后监控模型性能下降的程度。如果获得了更大的下降意味着特征更重要 实现代码 from sklearn.datasets import load_breast_cancer from sklearn.ensemble import RandomFore…

C语言之字符函数字符串函数篇(2)

目录 字符串查找 strstr strstr的使用 strstr的模拟实现 分析 考虑点 代码 strt strtok的使用 循环改进 错误信息报告 strerror 错误码的错误信息 strerror的使用 perror 字符操作 字符分类函数 字符转化函数 今天我们接着讲字符串函数&#xff0c;也…

LuatOS-SOC接口文档(air780E)--crypto - 加解密和hash函数

crypto.md5(str) 计算md5值 参数 传入值类型 解释 string 需要计算的字符串 返回值 返回值类型 解释 string 计算得出的md5值的hex字符串 例子 -- 计算字符串"abc"的md5 log.info("md5", crypto.md5("abc"))crypto.hmac_md5(str, k…