用于从未配对的3D医学图像中进行多模式分割的统一生成对抗性网络

Unified generative adversarial networks for multimodal segmentation from unpaired 3D medical images

  • 用于从未配对的3D医学图像中进行多模式分割的统一生成对抗性网络
    • 背景
      • 积累
    • 贡献
      • 难点:
      • 贡献:
    • 实验
      • Effect of the weight λshape(形状损失权重的影响)
    • 方法
      • Translation and segmentation unified framework(翻译与分割统一框架)
      • Cross-task skip connection(跨任务的跳跃连接)
    • 损失函数
    • Thinking

用于从未配对的3D医学图像中进行多模式分割的统一生成对抗性网络

Medical Image Analysis 64 (2020) 101731 Contents lists available at ScienceDirect

背景

为了充分定义临床诊断中感兴趣的目标对象,许多深度卷积神经网络(CNNs)使用多模式配对配准图像作为分割任务的输入。然而,在某些情况下很难获得这些成对的图像。此外,对于使用不同成像协议和扫描仪采集的图像,在一种特定模态上训练的细胞神经网络可能在其他模态上失败。因此,开发一个统一的模型,可以从不成对的多个模态中分割目标对象,这对许多临床应用具有重要意义。在这项工作中,我们提出了一个三维统一的生成对抗性网络,该网络将任意模态任意模态翻译多模态分割统一在一个网络中。由于解剖结构在模态翻译过程中得到了保留,因此辅助翻译任务用于提取模态不变特征隐式生成额外的训练数据。为了充分利用与分割相关的特征,我们添加了一个跨任务跳跃连接,从翻译解码器到分割解码器进行特征重新校准。腹部器官分割和脑肿瘤分割实验表明,我们的方法优于现有的统一方法。

积累

Multimodal segmentation in a unified model remains a challenging task for several reasons. First, only one modality image per patient is generally available for training rather than multiple modalities. The biomedical characteristics captured by different imaging techniques are not the same. Taking brain tumor segmentation as an example, T2-weighted Magnetic Resonance Imaging (MRI) highlights differences in tissue water relaxational properties, whereas the perfusion and diffusion MRI shows local water diffusion and blood flow (Menze et al., 2014). Learning these different image features in a single model is quite difficult due to the domain shift between multiple modalities. Second, in contrast to domain adaptation (Ghafoorian et al., 2017; Dou et al., 2019), multimodal segmentation aims to achieve good performance in both source and target domains, whereas domain adaptation aims at transferring the knowledge from the source domain to the target domain. Finetuning a complex network for each modality is not easy in medical practice.

由于几个原因,统一模型中的多模式分割仍然是一项具有挑战性的任务。首先,每个患者通常只有一个模态图像可用于训练,而不是多个模态。不同成像技术捕捉到的生物医学特征并不相同。以脑肿瘤分割为例,T2加权磁共振成像(MRI)突出了组织水松弛特性的差异,而灌注和扩散MRI显示了局部水扩散和血流(Menze等人,2014)。由于多个模态之间的域偏移,在单个模型中学习这些不同的图像特征是相当困难的。其次,与领域自适应相比(Ghafoorian et al.,2017;Dou et al.,2019),多模式分割旨在在源和目标领域都实现良好的性能,而领域自适应旨在将知识从源领域转移到目标领域。在医学实践中,为每种模态微调复杂的网络并不容易。

贡献

难点:

  • 每个患者通常只有一个模态图像可用于训练,而不是多个模态。不同成像技术捕捉到的生物医学特征并不相同,存在域差异。
  • 与领域自适应相比,多模式分割旨在在源和目标领域都实现良好的性能,而领域自适应旨在将知识从源领域转移到目标领域。为每种模式微调复杂的网络并不容易
  • 多模态分割的关键部分是提取模态不变特征
  • 现有方法都基于已经配准的网络进行模态缺失的合成,且会为每种模态设计单独的解码器,随着模态的增多,参数量也会增多。适用于未配对医学图像的轻量化网络对于多模式分割至关重要。

贡献:

  • 提出了一种新的多模态分割框架,将模态翻译和分割任务集成到一个统一的模型中。我们的框架可以很容易地适应任何细分网络。
  • 翻译任务可以看作是对分割任务的规范化。数据扩充是由模态转换图像隐含执行的。
  • 为了重新校准从翻译任务中提取的特征,我们添加了从翻译到分割解码器的轻量级跨任务跳过连接。详细的消融实验显示了我们新模块的贡献。
  • 我们的框架可以进行3D医学图像分割,这打破了袁等人(2019)中2D分割的限制。两个不同的临床数据集显示了3D图像处理的性能提升。

实验

由于不同任务和冗余信息的显著差异,采用更多的融合块会导致不稳定和性能下降。只在最后一层进行跨模态融合得到了最优的效果。
在这里插入图片描述

Effect of the weight λshape(形状损失权重的影响)

权重变化的消融实验,3的效果最好,用与不用的区别很大,用哪一种方式的区别不大
在这里插入图片描述
在这里插入图片描述

方法

在这里插入图片描述

Translation and segmentation unified framework(翻译与分割统一框架)

在模态转换过程中,目标物体的空间和结构信息得到了保留。为了更好地利用这些模态不变特征并在单个模型中执行多模态分割,我们在基础分割网络中嵌入了统一的多域翻译GANs。嵌入翻译和分割生成器G由一个共享编码器两个特定任务解码器组成。
由图像翻译与图像恢复两部分组成

  • 模态转换阶段,统一生成器学习将x转换为目标模态图像x′,并输出分割图y′。为了使生成的x′更真实并且与目标模态不可区分,在鉴别器D的顶部添加了一个分类,其中D={Dsrc,Dcls}。Dsrc学习识别真实图像和伪图像,而Dcls识别生成的图像属于哪个模态。判别器不仅判别合成影像的真伪,还判别合成模型属于哪个模态(分类判别)。
  • 模态恢复阶段,产生另一个差分向量dts,统一生成器以(x′,dts)为输入,学习重建原始模态图像G(x′、dts)→(x′′,y′′)。在金标准y和网络预测y′之间添加监督分割损失。我们还利用了形状一致性损失,以在模态翻译过程中保留x′中的器官结构。

Cross-task skip connection(跨任务的跳跃连接)

在这里插入图片描述
为了丢弃与分割无关的信息,我们采用了另一个轻量级的特征重新校准模块。我们与Hu等人的主要区别。(2018)和Asgari等人(2019)的主要区别在于,我们研究了不同任务之间的特征,而不是单个任务。
由于不同任务在高级信息中的差异,我们只添加了从翻译解码器的最后一层分割解码器的最后层的跨任务跳过连接,以避免融合翻译中更多的高级特征

损失函数

生成对抗损失,为了使生成的影像与目标影像无法区分
在这里插入图片描述
分类对抗损失,为了实现模态转换,Dcls通过最小化真实图像的分类损失来学习将x分类到其源模态v
在这里插入图片描述
循环一致性损失:
在这里插入图片描述
分割损失、形状一致性损失也是这个:
在这里插入图片描述
在这里插入图片描述

Thinking

可见直接用一种模态分割的效果Fseg的特征图,在红色区域表现不好,而Ftsl的特征图,可以看到明显的空洞区域,所以Fseg~的效果优于只用一种模态。
与直接从Fseg进行预测相比,从F Seg~进行预测为肝脏产生了更精确的边界。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/238463.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Android MVI架构之UI开发指南

Android MVI架构之UI开发指南 在整个应用程序架构中,UI层并不是唯一的层级。除了UI层之外,您还可以找到数据层,有时还有领域层。根据Android架构文档: UI层在屏幕上显示数据。数据层暴露应用程序数据,并包含大部分业…

自动评估作业,支持订正最终得分、查看关联代码|ModelWhale 版本更新

冬至时节,2023 已进入尾声,ModelWhale 于今日迎来新一轮的版本更新,与大家一起静候新年的到来。 本次更新中,ModelWhale 主要进行了以下功能迭代: 自动评估作业 新增 提交代码(团队版✓ )新增…

ARM GIC(四) gicv3架构基础

GICv3架构是GICv2架构的升级版,增加了很多东西。变化在于以下: 使用属性层次(affinity hierarchies),来对core进行标识,使gic支持更多的core 将cpu interface独立出来,用户可以将其设计在core…

Vue CLI 设置 publicPath:打包后的应用可部署在任意路径

前言 领导要重新部署多个应用环境,且不受路径层级影响。 于是找到了 Vue CLI 配置 publicpath 配置说明 下图所示: / :默认值,应用部署在根路径上;./:注意前面加了一个点,应用可部署在任意路…

算法基础之扩展欧几里得算法

扩展欧几里得算法 核心思想&#xff1a;裴蜀定理 : 欧几里得算法: 辗转相除法求最大公约数 传入参数(int a,int b,int &x,int &y) 递归(int b,int a%b,int y,int x) xy换位置 方便计算(推公式) #include<iostream>#include<algorithm>using namespac…

yolo-nas无人机高空红外热数据小目标检测(教程+代码)

前言 YOLO-NAS是目前最新的YOLO目标检测模型。从一开始&#xff0c;它就在准确性方面击败了所有其他 YOLO 模型。与之前的 YOLO 模型相比&#xff0c;预训练的 YOLO-NAS 模型能够以更高的准确度检测更多目标。但是我们如何在自定义数据集上训练 YOLO NAS&#xff1f; 这将是我…

效果图云渲染是什么意思?如何渲染出照片级别的效果图?

​在当前的建筑规划、室内装修以及电影视效制作等行业内&#xff0c;制作高质量的效果图起着至关重要的作用&#xff0c;因为它能够给予观众或客户极为逼真和吸引人的视觉体验。在此篇文章中&#xff0c;我们将深入了解什么是云端效果图渲染&#xff0c;并探讨如何运用Renderbu…

MySQL 分表真的能提高查询效率?

背景 首先我们以InnoDB引擎&#xff0c;BTree 3层为例。我们需要先了解几个知识点&#xff1a;页的概念、InnoDB数据的读取方式、什么是树搜索&#xff1f;、一次查询花费的I/O次数&#xff0c;跨页查询。 页的概念 索引树的页&#xff08;page&#xff09;是指存储索引数据…

7-1 建立二叉搜索树并查找父结点(PTA - 数据结构)

按输入顺序建立二叉搜索树&#xff0c;并搜索某一结点&#xff0c;输出其父结点。 输入格式: 输入有三行&#xff1a; 第一行是n值&#xff0c;表示有n个结点&#xff1b; 第二行有n个整数&#xff0c;分别代表n个结点的数据值&#xff1b; 第三行是x&#xff0c;表示要搜索值…

Kylin基础知识点解析与应用探索

目录 学习目标&#xff1a; 学习内容&#xff1a; 学习时间&#xff1a; 学习产出&#xff1a; Kylin简介 什么是Kylin Kylin的历史和发展 Kylin在大数据领域的地位和作用 Kylin架构 Kylin的组成部分和模块 Kylin的工作原理和流程 Kylin与其他大数据组件的关系和集成 Kylin功能…

链接未来:深入理解链表数据结构(二.c语言实现带头双向循环链表)

上篇文章简述讲解了链表的基本概念并且实现了无头单向不循环链表&#xff1a;链接未来&#xff1a;深入理解链表数据结构&#xff08;一.c语言实现无头单向非循环链表&#xff09;-CSDN博客 那今天接着给大家带来带头双向循环链表的实现&#xff1a; 文章目录 一.项目文件规划…

Java商城免 费 搭 建:VR全景到SAAS,各种模式一网打尽!

一、技术选型 java开发语言&#xff1a;java是一种跨平台的编程语言&#xff0c;适用于大型企业级应用开发。使用java开发直播商城可以保证系统的稳定性和可扩展性。 spring boot框架&#xff1a;spring boot是一个快速构建spring应用的框架&#xff0c;简化了开发过程&#xf…

人工智能对网络安全的影响

技术的快速发展带来了不断增长的威胁环境&#xff0c;网络犯罪分子和恶意行为者利用我们互联世界中的漏洞。在这个数字时代&#xff0c;数据泄露和网络攻击呈上升趋势&#xff0c;仅靠传统的安全措施已经不够了。人工智能 &#xff08;AI&#xff09; 的进步彻底改变了网络安全…

LeetCode 21 合并两个有序链表

题目描述 合并两个有序链表 将两个升序链表合并为一个新的 升序 链表并返回。新链表是通过拼接给定的两个链表的所有节点组成的。 示例 1&#xff1a; 输入&#xff1a;l1 [1,2,4], l2 [1,3,4] 输出&#xff1a;[1,1,2,3,4,4]示例 2&#xff1a; 输入&#xff1a;l1 [],…

由浅入深走进Python异步编程【多进程】(含代码实例讲解 || multiprocessing、异步进程池、进程通信)

写在前面 从底层到第三方库&#xff0c;全面讲解python的异步编程。这节讲述的是python的多线程实现&#xff0c;纯干货&#xff0c;无概念&#xff0c;代码实例讲解。 本系列有6章左右&#xff0c;点击头像或者专栏查看更多内容&#xff0c;陆续更新&#xff0c;欢迎关注。 …

高镍正极材料湿法回收除硼树脂

#高镍正极材料湿法回收除硼树脂 锂离子电池高镍正极材料具备高能量密度&#xff0c;能够满足现有电动交通工具对于高续航里程的要求&#xff0c;是现在市场中最受青睐的正极材料之一&#xff0c;然而&#xff0c;组分中高镍含量给材料带来高容量的同时也使材料稳定性变差&#…

大模型ChatGLM下载、安装与使用

在人工智能领域&#xff0c;清华技术成果转化的公司智谱AI启动了支持中英双语的对话机器人ChatGLM内测。ChatGLM是一个初具问答和对话功能的千亿中英语言模型&#xff0c; 并针对中文进行了优化&#xff0c;现已开启邀请制内测&#xff0c;后续还会逐步扩大内测范围。 ChatGLM…

【数据结构和算法】最大连续1的个数 III

其他系列文章导航 Java基础合集数据结构与算法合集 设计模式合集 多线程合集 分布式合集 ES合集 文章目录 其他系列文章导航 文章目录 前言 一、题目描述 二、题解 2.1 方法一&#xff1a;滑动窗口 2.2 滑动窗口解题模板 三、代码 3.1 方法一&#xff1a;滑动窗口 四、…

头歌—衍生密码体制

# 第1关&#xff1a;Rabin密码体制 题目描述 任务描述 Rabin密码体制是RSA密码体制的一种。 本关任务&#xff1a;使用Rabin密码体制对给定的明文进行加密。 相关知识 为了完成本关任务&#xff0c;你需要掌握&#xff1a;Rabin密码体制。 Rabin密码体制 在本关中&#x…