MedSegDiff: Medical Image Segmentation with Diffusion Probabilistic Model 论文总结

题目:MedSegDiff: Medical Image Segmentation(图像分割)with Diffusion Probabilistic Model(扩散概率模型)

论文(MIDL会议):MedSegDiff: Medical Image Segmentation with Diffusion Probabilistic Model

源码:MedSegDiff: Medical Image Segmentation with Diffusion Model (github.com)

一、摘要 

研究背景:扩散概率模型(Diffusion probabilistic model,DPM)是近年来计算机视觉领域研究的热点之一。其图像生成应用如Imagen、Latent Diffusion Models和Stable Diffusion已经显示出令人印象深刻的生成能力,引起了社区的广泛讨论。

主要工作:受DPM成功的启发,本文提出了第一个基于DPM的通用医学图像分割任务模型,命名为 MedSegDiff 为了增强DPM在医学图像分割中的 step-wise regional attention (逐步区域注意力),提出了动态条件编码,为每个采样步骤建立状态自适应条件。本文进一步提出特征频率分析器(Feature Frequency Parser, FF-Parser),以消除高频噪声分量在此过程中的负面影响

实验结果:在三个具有不同图像模态的医学分割任务上验证了MedSegDiff,这些医学分割任务是眼底图像上的视神经杯分割、MRI图像上的脑肿瘤分割和超声图像上的甲状腺结节分割。实验结果表明,MedSegDiff优于SOTA方法,但性能差距较大,表明了所提模型的泛化性和有效性。 

二、引言

研究背景概述(医学图像分割现实意义、作用 + 当前流行方法的概述)—> 扩散概率模型(DPM)简介(相关工作 + 应用领域) —> 受DPM成功的启发,设计了本文的主要工作:

1. 适应校准过程是获得精细结果的关键。遵循这种思维方式,本文提出动态条件编码,结合普通DPM来设计所提出的模型,称为MedSegDiff。注意,在迭代采样过程中,MedSegDiff 会将图像先验条件应用于每个步骤,以从中学习分割图。 针对自适应区域注意力,本文将在每个步骤中将当前步骤的分割图集成到图像先验编码中。 具体实现是采用多尺度方式将当前步骤的分割掩码与图像先验在特征层面进行融合动态条件编码实现。 这样,当前步骤掩码可以帮助动态增强条件特征,从而提高重建精度(建立状态自适应条件)。

2. 为了在该过程中消除给定掩码中的高频噪声,进一步提出了特征频率解析器(FF-Parser),以在傅里叶空间中过滤特征。 FFParser被应用于每个跳连接路径上的多尺度集成。

—> 实验结果 —> 贡献:

  • 1. 首次提出了基于dpm的通用医学图像分割模型。
  • 2. 针对逐步注意力提出了动态条件编码策略特征频率解析器(FF-Parser)被提出用于消除高频分量的负面影响。
  • 3. 在具有不同图像模态的三个不同医学分割任务上的SOTA性能。

三、方法

        本文在扩散模型的基础上设计了本文的模型。扩散模型是由正向扩散和反向扩散两个阶段组成的生成式模型。在正向过程中,通过一系列步骤逐步向分割标签 x_0 添加高斯噪声(加噪过程)。在反向过程中,通过反向噪声过程训练神经网络来恢复原始数据(去噪过程),可以表示为:

扩散模型详解:扩散模型 (Diffusion Model) 之最全详解图解-CSDN博客

扩散模型推导过程全过程概述 + 论文总结:Denoising Diffusion Probabilistic Models 全过程概述 + 论文总结-CSDN博客

推荐课程:大白话AI | 图像生成模型DDPM | 扩散模型 | 生成模型 | 概率扩散去噪生成模型_哔哩哔哩_bilibili 

---------------------------------------------------------------------------------------------------------------------------------------------------------------------------

核心:Difusion Models 由正向过程(或扩散过程)和反向过程(或逆扩散过程)组成,其中在正向过程中输入数据逐渐被噪声化,然后在反向过程中使用模型预测噪声值,推断出每一步还原图像的概率分布,最终实现图像的去噪。如下图所示:

原理:从根本上说,Difusion Models 的工作原理,是通过连续添加高斯噪声来破坏训练数据,然后通过反转这个过程进行去噪,来学习恢复数据。 

Q:为什么要这样做?

A:这样做的好处在于,一个训练好的完备的模型可以通过逆向过程从任意的符合 N(0,1) 高斯正态分布的纯噪声中生成图像,使得生成样本具有较高的质量和多样性。

模型概述:如上图所示,按照 DPM 的标准实施,采用UNet作为学习网络。为了实现分割,本文用原始图像先验来约束步长估计函数 ϵ,可以表示为:

其中 E^I_t 是条件特征嵌入,在本文的例子中是原始图像嵌入E^x_t 是当前步骤的分割图特征嵌入。将两个分量相加送入 UNet 解码器D进行重构。步骤索引 t 与添加的嵌入和解码器特征相集成。在这些方法中,都使用共享的学习查找表进行嵌入。

A. Dynamic Conditional Encoding ( 动态条件编码 )

问题:在大多数条件DPM中,条件先验将是唯一的给定信息。然而,医学图像分割因其对象的模糊性而闻名。病变或组织通常很难与其背景区分开来。低对比度的图像模式,如MRI或超声图像,使情况更加糟糕。只给出一个静态图像I作为每个步骤的条件将很难学习。

动机:为解决这个问题,本文为每个步骤提出了一种动态条件编码。注意到,一方面,原始图像包含准确的分割目标信息,但难以与背景区分开,另一方面,当前步骤的分割图包含增强的目标区域,但不准确。这促使本文将当前步骤的分割信息 x_t 集成到原始图像编码中,以实现相互补充

过程:具体来说,实现了特征级的集成。在原始图像编码器中,用当前步骤的编码特征增强其中间特征。将条件特征图 m_I^k 的每个尺度与具有相同形状的 x_t 编码特征 m_x^k 进行融合,k 为层的索引。融合通过类似于注意力的机制 \mathcal{A} 实现。特别地,两个特征图首先应用层归一化,并相乘以得到亲和图。然后,将亲和图与条件编码特征相乘,以增强注意力区域,即:

其中,⊗ 表示元素乘法,LN 表示层归一化。

结构:该操作应用于中间的两个阶段,其中每个阶段都是按照ResNet34实现的卷积阶段。

作用:这种策略有助于MedSegDiff动态地定位和校准分割。

B. FF-Parser ( FF-解析器 )

问题:虽然动态条件编码策略很有效,但另一个具体的问题是集成 x_t 嵌入会产生额外的高频噪声。为了解决这个问题,该文提出FF-Parser来约束特征中的高频成分。 

位置:通过特征集成的路径连接FF-parser。

作用:它的作用是约束 x_t 特征中与噪声相关的分量

思想:主要思想是学习一个参数化的注意力(权重)映射应用于傅里叶空间特征

过程:给定一个解码器特征映射 m \in R^{H\times W\times C} ,首先沿着空间维度执行2D FFT(快速傅里叶变换),可以表示为:

其中 F[·] 表示2D FFT。然后,通过将参数化的注意力映射 A\in C^{H\times W\times C} 乘以 M 来调制 m 的频谱: 

最后,通过FFT逆变换将M'变换回空间域

Q:快速傅里叶变换是怎么约束特征中的高频成分(高频噪声)的

A:

C. Training and Architecture ( 训练和架构 )

损失函数:MedSegDiff按照DPM的标准流程进行训练。具体地说,(KL散度)损失可以表示为:

在每次迭代中,将对原始图像 I_i 和分割标签 S_i 的随机对进行采样以用于训练(随机种子)。迭代次数从均匀分布中采样, ϵ 从高斯分布中采样。

主要架构MedSegDiff的主要架构是一个修改后的ResUNet,在UNet解码器之后使用ResNet编码器实现该网络I 和 x_t 由两个单独的编码器编码。编码器由三个卷积阶段组成。每个阶段包含多个残差块。每个残差块由两个卷积块组成,每个卷积块由 group-norm 和 SiLU 激活层和一个卷积层组成。残差块通过线性层、SiLU激活和另一个线性层接收时间嵌入。然后将结果添加到第一个卷积块的输出中。得到的 E^I 和 E^{x_t} 相加并发送到最后的编码阶段。最后,一个标准的卷积解码器被连接来预测最终结果。(DPM + 一个ResNet编码器

四、实验

A. Dataset

任务类型:在三种不同的医学任务上进行了实验,分别是眼底图像中的视杯分割、MRI图像中的脑肿瘤分割和超声图像中的甲状腺结节分割。

样本数量:青光眼、甲状腺癌和黑色素瘤诊断的实验分别在分别包含1200个、2000个和8046个样本的SAURGE-2数据集、BRATS-2021数据集和DDTI数据集上进行。

简要信息:这些数据集是公开提供的,带有分段和诊断标签。训练/验证/测试集按照数据集的默认设置拆分。

B. Implementation Details

扩散步数:在实验中,使用了100个扩散步骤来进行推理,这比以前的大多数研究要小得多。

实验设备:所有的实验都是在PyTorch平台上实现的,并在4个Tesla P40 GPU上进行了训练/测试,内存为24 GB。

预处理:所有图像都被均匀地调整到224×224像素的尺寸。

优化器和批量大小:使用AdamW优化器以端到端的方式训练网络,小批量为30个。学习速率初始设置为1×10−4。

C. Main Results

对比网络:ResUet和Beal用于视盘/杯分割,TransBTS 和 EnSemDiff 用于脑肿瘤分割,MTSeg 和 UltraUNet 用于甲状腺结节分割,CENet、MRNet、SegNet、NUNet和TransUNet用于普通医学图像分割。

评价指标:通过Dice评分和IOU来评估分割性能。

定量对比结果:可以看到MedSegDiff在三个不同的任务上都优于所有其他方法,这表明它对不同的医学分割任务和不同的图像形态具有普适性。与同样采用DPM的脑肿瘤分割方法相比,DICE的分割效率提高了2.3%,IOU的分割效率提高了2.4%,表明了本文所采用的动态条件化技术和FF-Parser技术的有效性。

定性对比分析:目标病变/组织在图像上都是模糊的,因此很难被人眼识别。与其他方法相比,显然该方法生成的分割图比其他方法更准确,尤其是对于模糊区域。 

D. Ablation Study 

评价指标:dice分数(%)来评估所有三个任务的性能。

从该表中,可以看到DyCond比Vanilla DPM有了相当大的改进。在区域定位比较重要的情况下,如视杯分割,提高了2.1%。对于图像对比度较低的情况,如脑肿瘤和甲状腺结节分割,分别提高了1.6%和1.8%。这表明Dy-Cond对于这两种情况都是一种总体上有效的DPM策略。建立在Dy-Cond上的FF-Parser算法有效地抑制了高频噪声,从而进一步优化了分割结果。它帮助MedSegDiff进一步提高近1%的性能,并在所有三项任务中实现最佳。 

五、结论

主要工作:本文提出了一种将DPM方法应用于一般医学图像分割任务的方案—MedSegDiff。提出了两种新的模型:

  • 1. 动态条件编码
  • 2. FF-Parser

实验效果:对三种不同图像形态的医学图像分割任务进行了对比实验,结果表明该模型的分割效果优于SOTA算法。

展望:作为DPM在普通医学图像分割中的第一个应用,我们相信MedSegDiff将成为未来研究的重要基准。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/16613.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

勇于创新,勤于探索 —— 我的创作纪念日

作者主页:爱笑的男孩。的博客_CSDN博客-深度学习,活动,python领域博主爱笑的男孩。擅长深度学习,活动,python,等方面的知识,爱笑的男孩。关注算法,python,计算机视觉,图像处理,深度学习,pytorch,神经网络,opencv领域.https://blog.csdn.net/Code_and516?typeblog个…

纯CSS丝滑边框线条动画

在这个网站(minimal-portfolio-swart.vercel.app)发现一个不错的交互效果,用户体验效果很不错。如封面图所示,这个卡片上有一根白色的线条围绕着卡片移动,且在线条的卡片内部跟随这一块模糊阴影,特别是在线…

关于Nginx热部署的细节分析

文章目录 前言一、环境准备二、热部署步骤总结 前言 Nginx由于其高并发、高性能、可扩展性好、高可靠性、热部署、BSD许可证等优势被广泛使用,本人主要针对热部署的部分展开说明热部署的具体步骤以及步骤背后发生的具体事情。 本次热部署采用的Nginx版本号为&…

高通 Android 12/13冻结屏幕

冻结屏幕很多第一次听到以为是Android一种异常现象,实则不然,就是防止用户在做一些非法操作导致问题防止安全漏洞问题。 1、主要通过用户行为比如禁止下拉状态栏和按键以及onTouch事件拦截等,不知道请看这篇文章(Touch事件传递流…

GitHub打不开的解决方案

1、打开https://sites.ipaddress.com/github.com/找到DNS Resource Records,复制github的ip地址,先保存起来: 140.82.112.32、打开https://sites.ipaddress.com/fastly.net/找到DNS Resource Records,复制其中一个ip地址&#xf…

基于Nacos实现Sentinel规则持久化

基于Nacos实现Sentinel规则持久化 一、Sentinel使用痛点二、解决方案2.1 保存本地文件2.2 保存数据库2.3 保存到Nacos 三、规则持久化到Nacos3.1 Nacos服务端修改配置3.2 Sentinel控制台修改配置3.3 Nacos数据源整合到Sentinel中 一、Sentinel使用痛点 SpringCloudAlibaba帮我…

迷你手持小风扇哪个牌子质量好点?这五款迷你手持小风扇不要错过

随着空调的普及,我们对夏日热浪的抵抗力逐渐减弱。当从凉爽的空调屋步入闷热的户外、拥挤的交通工具或公共场所时,如何抵御热浪的侵袭成为大众关注的焦点。在这样的背景下,迷你手持小风扇凭借其便携性和即时降温功能,成为众多人的…

降价!免费!AI大模型开启价格战,企业如何“薅”出绿色财富?

近期,国内大模型技术供应商之间的价格战,使得这项原本成本较高的技术变得更加亲民,极大降低了企业的技术采用门槛。这不仅为企业提供了经济实惠的技术解决方案,更为他们的绿色低碳转型之路带来了新的机遇。 随着全球气候变化问题…

MySQL -- 相关知识点

1.数据库相关介绍 数据库的选择通常取决于具体的应用需求,如性能、扩展性、数据一致性和易用性等因素。 1. 关系型数据库(RDBMS) MySQL: 广泛使用的开源数据库,支持大多数操作系统。强调易用性、灵活性和广泛的社区支…

基于Java+MySQL+Swing的学生管理系统

1.系统简介和开发背景 该同学工作积极主动、高效,学习认真,待人诚恳,能够做到服从指挥、认真听取老同志的指导,不怕苦、不怕累,表现有较强的求知欲,积极观察、体验、思考,并能够灵活运用自己的知…

自养号测评是什么?亚马逊、沃尔玛、Target卖家如何建立自己的护城河?

近期有跨境卖家咨询我自养买家账号测评的事情,他们还是有不了解自养号测评的,所以珑哥觉得有必要再讲一下卖家测评的一些事情,之前文章也说过。这可能是跨境卖家运营的一个趋势。今天珑哥着重来介绍一下自养号测评 一、什么叫做自养号测评&a…

OrangePi AIpro初体验之图片视频检测案例真实测评

OrangePi AIpro简介 OrangePi AIpro官网 Orange Pi AI Pro 开发板是香橙派联合华为精心打造的高性能AI 开发板,其搭载了昇腾AI 处理器,可提供8TOPS INT8 的计算能力,内存提供了8GB 和16GB两种版本。可以实现图像、视频等多种数据分析与推理…

全球点赞最高的人颜廷利:真正的人生目标是什么

在那个充满生机的2024年春天,记者有幸对中国第一起名大师的老师颜廷利教授进行了深入的访谈。带着对其人生哲学的强烈好奇,记者紧张而期待地提出了问题:“颜教授,您在漫长的人生旅途中最追求的是什么?” 宁夏银川、山东…

PMP考试没有考过应该如何再考?

一、接受失败,理性分析 其实,PMP考试可以在PMI一年有效期内提交补考申请,若已经过了一年有效期,考生则需要重新进行完整的PMP考试报名流程。PMP考试补考费用:2500元/次。 1.接受失败:接受并处理情绪。面对…

【Python数据分析】基于自回归积分滑动平均模型的疫情分析报告 附完整python代码

资源地址:Python数据分析大作业 2000字 图文分析文档 疫情分析完整python代码 数据分析 数据来自法国疫情数据 资源地址:Python数据分析大作业 2000字 图文分析文档 疫情分析完整python代码 代码详解 完整代码文件 主要是对时间序列数据进行分析和预…

技术面‍:前端代码是如何与服务器交互的

前言: 本篇文章主要是想讲解 .html 文件和 .CSS 文件在实际开发中和后端服务器交互最后上线的基础原理。 面向的人群🆕:是刚入行不久,且目前只会写前端业务代码而不清楚整个工作流的前端新人。我会从 0 开始一步一步带你理解整个…

大规模敏捷SA(Leading SAFe)证书是什么意思?如何报名,含金量高吗?

大规模敏捷SA(Leading SAFe)证书是什么意思? 常规的敏捷框架适用于中小型项目团队,而且不具有扩展性。基于常规的敏捷框架,SAFe定义了一个可扩展的敏捷框架模型,它适用于大型团队的合作开发,可以提高团队之间的协作性…

【再探】设计模式—职责链模式、命令模式及迭代器模式

行为型设计模式研究系统在运行时对象之间的交互,进一步明确对象的职责。有职责链模式、命令模式、解释器模式、迭代器模式、中介者模式、备忘录模式、观察者模式、状态模式、策略模式、模板方法模式及访问模式共11种。 1 职责链模式 需求:1) 请求能被多…

如何使用golang自带工具对代码进行覆盖率测试

在 Go 语言中,测试代码覆盖率通常使用 go test 命令结合 -cover 和 -coverprofile 1. 基本代码覆盖率报告 在项目目录下运行以下命令 go test -cover这将在控制台输出一个代码覆盖率的百分比。但是,这种方式不会保存覆盖率数据(可以指定目…

反对加征关税,特斯拉上海厂传减产20% | 百能云芯

特斯拉公司首席执行官马斯克近日在公开场合表达了对美国计划对中国电动车加征关税的反对立场,强调特斯拉不支持任何扭曲市场的举措。据知情人士透露,特斯拉上海工厂正计划在今年第二季度至少削减Model Y车型的产量20%,以应对市场需求的变化。…