Diffusion Mamba:用于CT到MRI转换的Mamba扩散模型

Diffusion Mamba:用于CT到MRI转换的Mamba扩散模型

    • 提出背景
      • 拆解
      • 左侧:整体框架
      • 中间:Mamba块的细节
      • 右侧:螺旋扫描的细节

 


提出背景

论文:https://arxiv.org/pdf/2406.15910

代码:https://github.com/wongzbb/DiffMa-Diffusion-Mamba

使用图像生成模型,尤其是扩散模型和生成对抗网络(GANs),将计算机断层扫描(CT)图像转换为磁共振成像(MRI)图像的可能性。

这种转换尝试在不增加额外成本的情况下扩展诊断检查的范围。CT成像在成本效益和速度方面表现优异,尤其适用于骨骼和钙化组织,但在软组织的成像上存在限制,而MRI则提供了更高清晰度的软组织图像,但成本和时间上的需求较高。

Mamba模型,作为一种在SSMs中引入时变参数以提高并行处理效率的技术,已经被扩展应用到视觉和医学图像生成中。

这项技术特别适合处理大规模和高维度数据,但在处理图像数据时,直接应用Mamba可能会影响图像的空间完整性。因此,引入了新的扫描技术,如螺旋扫描模块,以保持图像结构的连续性和完整性。

此外,这项研究还提出了通过视觉嵌入器预训练和跨序列监督来优化重要区域的权重分配,从而更精确地重建MRI图像。

通过这种方法,研究人员能够在保持参数数量不变的情况下,比传统的基于CNNs和ViTs的方法取得更好的性能。

拆解

扩散模型架构Diffusion Mamba(简称DiffMa),该模型专为MRI图像的扩散模型训练而设计。


这张图描绘了Diffusion Mamba(DiffMa)框架的结构细节,特别强调了用于MRI图像生成的扩散模型的各个组件和工作流程。

左侧:整体框架

  • 嵌入层:首先,噪声潜在MRI图像通过嵌入层进行处理,这一层处理输入的图像,将其分解成多个块,并且为每个块添加条件标签(如m、c、t等)。
  • Mamba块序列:这些输入块随后被一系列Mamba块处理,这些块通过长跳连接和线性处理层次地处理这些数据。
  • 重排和线性层:处理后的数据被重新排列,并通过线性层进行进一步的处理,最终生成预测的噪声图像。

中间:Mamba块的细节

  • 条件处理:输入令牌被带有条件信息的多层感知机(MLP)处理,这有助于模型根据给定的医学条件进行更精确的生成。
  • 螺旋扫描:采用螺旋扫描技术来处理输入数据,此技术通过对数据进行螺旋形扫描来强调结构信息,增强生成图像的质量。
  • 层标准化和比例变换:在螺旋扫描后,数据通过层标准化进行标准化,并进行必要的比例和位移调整。

右侧:螺旋扫描的细节

  • 前向扫描和1D卷积:展示了螺旋扫描内部的细节,包括前向扫描和1D卷积层,这有助于处理和识别图像序列中的关键特征。
  • 层标准化:最后,通过层标准化确保数据的一致性和标准化。

这个图形展示了DiffMa模型在处理医学图像,尤其是MRI图像时的复杂性和多层次处理结构,突出了在模型中使用的先进技术,如螺旋扫描和条件化的多层感知机。

这种结构旨在提高生成图像的精确度和相关性,特别是在处理具有复杂内部结构的医学图像时。

DiffMa使用视觉Mamba处理图像块序列。

特别关注螺旋扫描和跨序列注意力两个组件。

  1. 子解法1:使用螺旋扫描模块
    • 功能:在处理图像块时保持空间连续性。
    • 原因:传统的扫描模式可能无法有效考虑空间连续性,螺旋扫描可以通过特定的排序模式保持图像块之间的结构关系,从而保持空间信息的完整性。

在这里插入图片描述

这张图显示了2D图像螺旋扫描的八种不同模式。

每个模式包括两种方向的扫描方式,这些模式在处理图像数据时被用来以不同的顺序遍历图像的像素或区块。

图中每种扫描方式的详细说明如下:

  1. 左上至右下:两行四列的图表展示了螺旋形扫描的不同方式。

    • 第一行从左到右显示了螺旋向内和向外的顺时针方向。
    • 第二行从左到右显示了逆时针方向的螺旋向内和向外。
  2. 每种模式的用途

    • 顺时针和逆时针螺旋:两种基本方向,顺时针通常用于常规的数据扫描,而逆时针则可能用于特殊情况或提供不同的数据视角。
    • 向内和向外:螺旋可以从外围向中心移动,或者从中心向外扩展,这两种方式可以根据数据的特性和需要突出的图像区域来选择使用。
  3. 实际应用

    • 每个块在处理图像时选择其中一个扫描模式,这有助于模型更好地理解和解析图像的结构和空间关系。
    • 不同的螺旋扫描模式可以用来强调图像的不同特性,例如,从外向内的扫描可能更关注中心特征,而从内向外的扫描则可能更注重边缘特征。

这些螺旋扫描模式为图像分析提供了灵活的方法,使得图像处理模型能够根据不同的应用场景选择最合适的数据遍历方式,从而优化性能和结果。

通过这样的技术,可以在保留关键结构信息的同时,增加处理图像数据的维度和深度。

  1. 子解法2:采用跨序列注意力机制

    • 功能:增强模型对于不同图像块序列中的细微差异的识别能力。
    • 原因:在扩散模型中,理解和利用图像块间的关系对于生成高质量的MRI图像至关重要。跨序列注意力通过对CT图像块生成的软掩模和嵌入进行处理,使模型能够更加精确地关注图像中的关键区域。
  2. 子解法3:利用变分自编码器(VAE)生成噪声潜在空间表示

    • 功能:为MRI图像提供一个初始的噪声潜在空间表示,作为DiffMa模型的输入。
    • 原因:噪声潜在空间表示可以模拟实际MRI图像在成像过程中可能出现的随机变异,为模型训练提供更加真实的数据基础。
  3. 子解法4:使用视觉编码器和视觉嵌入器对CT图像进行处理

    • 功能:将CT图像转换为适合模型处理的嵌入向量。
    • 原因:通过专门的视觉编码器,如BioMedCLIP,和预训练的视觉嵌入器处理CT图像,可以精确地捕捉CT图像与MRI图像之间的差异,为后续的扩散过程提供关键信息。

在这里插入图片描述
这张图展示了视觉嵌入器(Vision Embedder)的框架,这是用于处理CT图像数据的神经网络架构,旨在生成图像嵌入和软掩膜,以供进一步的图像处理和分析使用。

  1. 潜在CT

    • 原始的CT图像数据作为输入,显示在图像左下角。
  2. 卷积层和展平(Conv2d & Flatten)

    • 图像数据首先经过二维卷积层(Conv2d)处理,这有助于提取图像的空间特征。
    • 卷积后的数据通过展平操作转换成一维数组,以便进行进一步处理。
  3. 池化层(MaxPool2d & AvgPool2d)

    • 使用最大池化(MaxPool2d)和平均池化(AvgPool2d)技术对卷积后的特征进行下采样,这有助于减少计算量并保留关键信息。
  4. 多层感知机(MLP)

    • 池化后的数据送入多层感知机(MLP),MLP能够进一步处理数据,学习更高级的特征表示。
  5. 标准化层和加权组合(Layer Norm, ⊗ & σ)

    • 在数据进入MLP之前,先经过层标准化(Layer Norm),保证数据在不同的批次间具有相同的分布。
    • 数据通过一个特殊的操作(⊗ & σ),可能表示了一个加权或标准化步骤,用于调整和优化特征权重。
  6. 输出:CT嵌入和软掩膜(CT Embeddings & Soft Masks)

    • 最终,生成的CT嵌入和软掩膜被输出。CT嵌入为后续处理提供了密集的特征表示,而软掩膜可能用于指导或优化图像生成过程中的注意力机制。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/860486.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【HarmonyOS4学习笔记】《HarmonyOS4+NEXT星河版入门到企业级实战教程》课程学习笔记(十七)

课程地址: 黑马程序员HarmonyOS4NEXT星河版入门到企业级实战教程,一套精通鸿蒙应用开发 (本篇笔记对应课程第 27节) P27《26.Stage模型-UIAbility的启动模式》 本节讲解 UIAbility的启动模式:Stage模型的应用&#x…

策略模式-通过枚举newInstance替代工厂

策略模式-使用枚举newInstance 前言一、枚举类:MarkCheckDataTypeEnum二、抽象类:AbstractMarkChecker三、检查类:MarkPeopleChecker四、demo演示总结 前言 很久没写文章了~~ 吐槽下:入职新公司后,基本在搬砖&#xf…

这几个PR小技巧你Get到了吗?

学习是永无止境的,需要不间断地学习,获取新知识。今天带来了5个PR小技巧,可以先收藏起来Adobe Premiere Pro 2024的获取查看Baidu Cloud 1、双倍稳定画面更舒适 一般来说大型电视剧、电影使用的拍摄设备都是非常高端的,不像我们…

【研究】国内外大模型公司进展

2022年11月,OpenAI推出基于GPT-3.5的ChatGPT后,引发全球AI大模型技术开发与投资热潮。AI大模型性能持续快速提升。以衡量LLM的常用评测标准MMLU为例,2021年底全球最先进大模型的MMLU 5-shot得分刚达到60%,2022年底超过70%&#xf…

面相对象程序设计

面相对象程序设计包含内容如下 局域网聊天程序设网页浏览器设计电子日历记事本的设计 以其中的一个的报告进行举例 1需求与总体设计 1 1.1需求分析 1 1.2总体设计方案 1 1.2.1系统功能分析以及功能表 1 1.3系统类图的关系以及表之间的联系 2 2详细设计 3 2.1 Manag…

vuex的actions返回结果类型是promise及actions方法互相调用

this.$store.dispatch(‘logout’)返回的结果是Promise类型的 调用成功的情况下,返回状态为fulfilled,值为undefined。 所以可以直接进行.then操作: this.$store.dispatch(logout).then((result) > {console.log(result); });因为 Vuex …

ARM day1练习 求1~100内的和

题目要求:用ARM汇编语言实现1~100之间之和(5050 0x13BA) .text 声明以下内容是文本段的内容 .global _start .global声明_start标签是一个全局标签_start:mov r1,#0x0 r1 summov r2,#0x1 r2 ifun: 加法函数cmp r2,#100 r2中的值和100作比较add…

理解CNN模型如何学习

深度学习模型常常被认为是不可解释的。但是人们正在探索不同的技术来解释这些模型内发生了什么。对于图像,由卷积神经网络学习的特征是可解释的。我们将探索两种流行的技术来理解卷积神经网络。 可视化中间层的输出 可视化中间层的输出将有助于我们理解输入图像如何…

JupyterLab使用指南(七):JupyterLab使用 LaTeX 生成数学公式

在 JupyterLab 中,可以使用 LaTeX 语法生成复杂的数学公式。JupyterLab 内置对 LaTeX 的支持,使得我们可以方便地在 notebook 中编写和展示数学公式。以下是详细的步骤和示例。 1. 使用 LaTeX 生成数学公式 LaTeX 是一种专门用于排版数学公式的语言。J…

Stable Diffusion 插件安装与推荐,助力你的AI绘图

在上一篇文章我们安装了Stable Diffusion ,这篇文章我们来安装Stable Diffusion的插件 Stable Diffusion的插件是绘画中重要的一环,好的插件可以让你的绘画更加得心应手 中英双语插件 为什么要安装中英双语插件呢,不能只安装中文插件吗&…

安卓应用开发学习:获取导航卫星信息

一、引言 我昨天写了《安卓应用开发学习:获取经纬度及地理位置描述信息》日志,今天再接再厉,记录一下跟着《Android App 开发进阶与项目实战》一书,实现获取导航卫星信息,并在手机上显示的功能的情况。先上实现后的在…

Redis的持久化方式和注意点

redis持久篇 两种持久化技术: AOF日志和RDB快照 Redis默认会开启RBD快照 AOF:持久化只会记录写操作命令。 是一种日志,写入到文件,有相应的格式文本 就是 Redis 里的AOF(Append Only File)持久化功能,注意只会记录写操作命令…

决定马萨诸塞州版图的关键历史事件

决定马萨诸塞州版图的关键历史事件: 1. 早期探索与*民定居:17世纪初,英国清教徒为寻求宗教自由,乘坐“五月花号”到达新大陆,并于1620年在现在的普利茅斯建立了第一个永久性英国*民地。随后,更多的英国*民…

LKD-Net: Large Kernel Convolution Network for Single Image Dehazing

LKD-Net:用于单幅图像去噪的大型核卷积网络 摘要 基于深度卷积神经网络(CNN)的单幅图像去噪方法已经取得了很大的成功。以往的方法致力于通过增加网络的深度和宽度来提高网络的性能。目前的方法侧重于增加卷积核的大小,以受益于更大的接受野来增强其性能…

昇思25天学习打卡营第1天|新手上路

这里写自定义目录标题 打卡昇思MindSpore扫盲快速入门 打卡 昇思MindSpore扫盲 第一节基本是一个mindspore的科普扫盲。大概介绍一通mindspore的一些架构,feature,以及其对比于其他同类框架的优势。简单扫读了一遍大概有点印象直接跳过。 快速入门 这…

Vue 3 中处理文件上传和响应式更新

Vue 3 中处理文件上传和响应式更新 一、前言1.创建文件上传组件2.解释代码3.在主应用中使用文件上传组件4.总结 一、前言 在现代 web 开发中,文件上传是一个常见需求。本文将详细介绍如何在 Vue 3 中处理文件上传,并确保上传后的文件列表能够响应式更新…

如何把图片转换成pdf格式?图片转PDF方法分享

如何把图片转换成pdf格式?图片转换为PDF格式的重要性不言而喻。PDF文件不仅能够在各种操作系统和设备上保持一致的显示效果,还能确保图片内容的清晰度和质量不受损害。此外,PDF格式支持加密和权限设置,可以保护图片内容不被轻易篡…

FireFox 编译指南2024 Windows10篇-环境准备(一)

1. 引言 在开源浏览器项目中,Firefox因其高性能和灵活性而备受开发者青睐。为了在本地环境中编译和定制Firefox,开发者需要做好充分的环境准备工作。这不仅是编译成功的基础,也是后续调试、优化和二次开发的关键步骤。 编译Firefox是一个复…

深入剖析Tomcat(十二) 详解StandardContext

StandardContext是Context容器的一个标准实现,一般情况下,Tomcat都是使用StandardContext类来创建Context容器。前面讲过,Context容器代表了一个Web应用,Tomcat本身支持部署多个应用,相应的每个应用都会有一个Standard…

实用软件下载:ABBYY Finereader 15最新安装包及详细安装教程

数据表明FineReader PDF提供实用、简易的工具,将纸质文档和PDF结合起来,提高了数字工作场所的效率。我们都知道 即时背景识别:使不可搜索的PDF能够在工作中立即使用。值得一提的是文档转换更精准:OCR技术,它提高了PDF转换、布局保…