SvANet:微小医学目标分割网络,增强早期疾病检测

SvANet:微小医学目标分割网络,增强早期疾病检测

    • 提出背景
      • 前人工作
        • 医学对象分割
        • 微小医学对象分割
        • 注意力机制
    • SvANet 结构图
      • SvANet 解法拆解
        • 解法
        • 逻辑链

 


论文:SvANet: A Scale-variant Attention-based Network for Small Medical Object Segmentation

代码:https://github.com/anthonyweidai/SvANet

提出背景

一种新型神经网络,名为SvANet,该网络专为图像中小型医疗对象的分割而设计,这对于早期疾病检测和准确诊断至关重要。

  1. 问题背景:早期检测和诊断疾病可以显著提高治疗效果。当疾病表现为医学图像中的小感染区域时,这一点尤为重要,因为这些小区域难以准确检测。

  2. 当前挑战:传统的深度学习模型,如卷积神经网络(CNNs),在小对象分割方面常常遇到困难,因为它们通过重复的处理步骤(如卷积和池化)丢失了重要细节。随着模型对图像数据更深层的处理,这个问题会加剧。

  3. SvANet解决方案:提出的SvANet通过以下方式解决这些挑战:

    • 蒙特卡罗注意力:此组件在不同的尺度上生成注意力图,帮助网络了解在图像中应该关注的位置。
    • 尺度变化注意力:这可能允许网络对图像中不同大小的特征给予不同程度的关注,这对检测小对象至关重要。
    • 视觉变压器:结合传统的卷积方法和视觉Transformer,以捕获图像中的局部和更全局的特征。
       
      这种模型以一种类似于Transformer处理序列的方式处理图像,可能更好地捕捉全局上下文。
  4. 性能:SvANet在多种类型的医学图像中分割小医疗对象方面表现出色,通过在几个数据集上的高分表现得到证明,非常接近医生的诊断结果。

    这些数据集包括肾肿瘤、皮肤病变、肝肿瘤、视网膜等图像,其中感兴趣的对象与整个图像大小相比非常小。

SvANet是一种复杂的工具,旨在增强医学成像中微小、可能表明疾病的异常的检测,从而支持更好的早期诊断实践。

前人工作

这段内容主要讨论了医学图像分割中几个关键的研究领域和技术进展,特别是如何处理小尺寸的医疗对象。我来为你简化解释每一部分:

医学对象分割
  • 基础技术: 使用编码器-解码器结构进行医学图像分割。这种结构首先通过编码器提取特征,然后通过解码器生成分割掩码,以区分图像中的不同医学对象。
  • U形结构: 通过使用卷积层连接编码器和解码器的分支,这种结构帮助信息在网络中有效传播,用于更好地分割图像中的对象,如肿瘤细胞等。
微小医学对象分割
  • 挑战: 深度学习中的卷积和池化操作可能会压缩输入数据,损害医学对象的形态特征。
  • 解决方案: 提出多种方法来改善小尺寸对象的分割效果,包括使用空洞卷积、跳跃连接、特征金字塔、多列结构和注意力机制等,这些技术有助于提取和放大图像中的小对象特征。
注意力机制
  • 应用: 在语义分割中广泛使用注意力机制来突出重要特征。
  • 技术创新: 结合通道注意力和空间注意力,提高多维特征的学习能力和分割精度。还引入了反向注意力和自注意力技术,以提取更细致的边界信息和增强输入数据内部的依赖关系。

 

SvANet 结构图

在这里插入图片描述

这张图是一个复杂的神经网络架构图,称为SvANet,用于医学图像的小物体分割。

  1. 输入图像: 最左侧展示了不同医学成像方式的小医疗对象的图片,包括全幅成像(WSI)、眼科成像(Oph)、皮肤科成像(Derm)、结肠镜检查(COL)、磁共振成像(MRI)、计算机断层扫描(CT)、和显微镜成像(MSCP)。

  2. MCAtn(蒙特卡罗注意力)模块: 在左上方的虚线框内,这部分通过使用不同规模的池化输出大小来生成注意力图,从而在单一阶段内学习小物体的空间信息和对象关系。

  3. SvAttn(尺度变化注意力)模块: 在顶部中间的虚线框内,此模块生成基于逐步压缩的特征图的注意力图,从而捕捉小医疗对象的位置和形态本质。

  4. AssemFormer: 在右上角的虚线框中,这部分结合了卷积和视觉变换器,通过组装张量来融合局部空间层次和片间表示,提供图像数据的全面理解。

  5. 卷积与池化操作: 图中展示了多阶段的卷积和池化操作,这些都是深度学习中常用的技术,用于提取特征和降低维度。

  6. ASPP(空洞空间金字塔池化): 在预测步骤之前,这一模块用于捕捉图像中的上下文信息,有助于改善分割的准确性。

  7. 预测输出: 图的右下角展示了不同成像方式的医学图像分割结果。

整体来看,这个架构通过结合传统的卷积神经网络和最新的视觉变换器技术,旨在更有效地检测和分割医学图像中的小型对象,特别是在复杂和信息丰富的医疗图像处理场景中。

 

以视网膜图像分割为例:

  1. 输入图像: 在此例中,输入图像为视网膜成像(Oph),如图中左侧部分所示。视网膜图像通常用于诊断各种眼病,如糖尿病性视网膜病变等。

    视网膜图像的分辨率和细节要求极高,因为需要精确地识别和分割出细微的血管和病变区域。

  2. MCAtn(蒙特卡罗注意力): 这一模块处理视网膜图像,通过不同规模的池化来创建注意力图,这有助于模型在不同大小的结构上聚焦,特别是小而重要的细节,如微小血管或早期病变。

  3. SvAttn(尺度变化注意力): 在处理视网膜图像时,这个模块通过分析不同尺度的特征图来更好地理解图像的深层结构。

    它帮助模型在不同层次上了解视网膜的复杂结构,特别是在图像中较难观察到的部分。

  4. AssemFormer: 这个部分将卷积层和视觉变换器的优势结合起来,通过组装张量,提供对视网膜图像局部和全局特征的深入理解。

    它有效地整合了视网膜图像中的局部细节和整体结构信息,有助于提高分割的准确性和鲁棒性。

  5. 预测输出: 最终,模型预测视网膜图像中的关键特征,如图中右下角的示例。

    这可以包括分割血管、识别病变区域等,这些信息对于后续的诊断和治疗规划至关重要。

通过这种高级别的网络架构,SvANet能够处理复杂的视网膜图像,并执行精确的医学图像分割任务,从而支持眼科医生更好地诊断和治疗眼部疾病。

这样的技术进步对于提早诊断和治疗许多潜在严重的眼部疾病具有重要意义。

SvANet 解法拆解

目的:提高对医学图像中小型医疗对象的分割和识别精度。

问题

  1. 小型医疗对象在图像中的特征不明显,易被忽略。
  2. 多尺度的特征捕捉困难,导致在不同尺寸和深度的特征识别上存在局限性。
  3. 传统的卷积网络在处理极小对象时信息丢失严重。
解法

消融实验:蒙特卡洛注意力 (MCAttn) 和 交叉尺度引导是提高预测精度的关键组件,而AssemFormer和MCBottleneck对提高阳性诊断(有某种疾病存在)的准确性至关重要。

  1. 蒙特卡洛注意力 (MCAttn)
    • 特征:使用随机采样的池化操作生成尺度不依赖的注意力图,允许模型在不同尺度上捕捉关键信息。
    • 原因:传统的全局平均池化在捕获跨尺度相关性方面能力有限。
    • 例子:在处理含有细小血管的视网膜图像时,MCAttn 能够增强模型对这些微小结构的识别能力。

处理特征提取过程中的尺度不变性,强化模型在处理小尺度特征时的表现。

与传统的全局注意力机制相比,MCAttn在特定的池化层中实施,直接增强了小对象特征的识别率,减少了背景噪声的干扰。

在这里插入图片描述

图显示了使用不同注意力机制的MCBottleneck和跨尺度引导(Cross-scale Guidance)生成的输出特征图。

  • (a) 输入图像:原始的医学图像。
  • (b) 地面真实情况(Ground Truth):标注了正确的医学对象位置和形态。
  • ©, (d), (e), (f):不同注意力机制(如SE、CBAM、CoorAttn)下的输出特征图,展示了模型如何处理输入图像并突出不同特征。
  • (g) 单元格代表使用蒙特卡洛注意力机制的输出特征图

通过对比 (b)、(g),这些图表展示了SvANet和其他模型如何在处理细小和微小医学对象方面的不同,特别是在保留细节和精确定位方面的能力。

  1. 跨尺度特征引导
    • 特征:利用早期模型阶段的高分辨率特征来指导后续阶段的特征学习。
    • 原因:小型医疗对象的信息内容随对象尺寸减小而显著减少,需要额外的引导来增强特征的学习。
    • 例子:在处理多层次的皮肤癌图像时,跨尺度特征引导帮助模型在深层学习小癌症区域的同时,不丢失浅层的高分辨率细节。

通过跨不同阶段的特征引导来增强模型对细节的捕捉能力。

利用高分辨率特征来指导模型在后续阶段更好地学习小尺度医疗对象的特征。

  1. 尺度变化注意力 (SvAttn)
    • 特征:处理全局特征表示有局限性,通过跨多个尺度处理全局依赖性。
    • 原因:需要在保持长距离相关性的同时克服单一尺度特征的局限。
    • 例子:在处理MRI图像中的小肿瘤时,SvAttn 允许模型在不同的尺度上有效分辨肿瘤和正常组织。

使模型能在不同尺度上动态调整,从而更精准地识别和分割小尺度医疗对象。

  1. 与视觉变换器结合的卷积 (AssemFormer)

    • 特征:结合了卷积和变换器的优势,同时学习局部和全局特征。
    • 原因:变换器缺乏归纳偏见,需要与卷积结合来增强特征学习。
    • 例子:在处理复杂的脑部图像时,AssemFormer能够同时捕捉到精细的局部结构(如血管和神经纤维)和整体的脑区分布。

     
    结合了卷积和变换器操作,同时学习输入医学图像的局部和全局特征。

    通过融合两种技术的优势,增强模型对医疗对象形态、深度和颜色分布的全局信息捕捉能力。

逻辑链

这些子解法构成一个网络式的逻辑链,其中每个子解法相互支持,共同解决小型医疗对象识别和分割的问题:

  • 蒙特卡洛注意力 提供了跨尺度的特征识别能力。
  • 跨尺度特征引导 利用高分辨率特征强化后续学习。
  • 尺度变化注意力 进一步增强跨尺度特征的全局依赖处理。
  • 与视觉变换器结合的卷积 结合局部与全局特征学习,确保详细和全面的对象分割。

这种方法能够显著提高对医学图像中小型和超小型对象的分割精度,对提早发现和诊断疾病至关重要。

在这里插入图片描述
这张图展示了在不同数据集(ATLAS、KiTS23和SpermHealth)中对各种医学对象(如肿瘤、囊肿和精子)的分割结果。

这些示例反映了不同模型在处理超小对象、小对象和超过10%面积的对象时的效果:

  • (a) 输入图像:原始医学扫描图。
  • (b) 地面真实情况(Ground Truth):用不同颜色标记的医学对象,例如绿色代表肝脏,红色代表肿瘤。
  • © HRNet的预测结果。
  • (d) TransNetR的预测结果。
  • (e) SvANet的预测结果(即本文提出的方法)。

图中显示SvANet在定位和识别医学对象方面通常比其他方法更为准确和详细,特别是在细节和边界的识别上。

视网膜血管分割:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/44486.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【JAVA poi-tl-ext 富文本转word】

富文本转word 环境使用poi-tl-ext的原因富文本转word代码 环境 jdk 1.8 <dependency><groupId>io.github.draco1023</groupId><artifactId>poi-tl-ext</artifactId><version>0.4.16</version> </dependency>poi-tl-ext已经包…

可灵重大升级!新增Web端上线、首尾帧控制、单次生成视频时长增加至10s!

快手视频生成大模型“可灵”&#xff08;Kling&#xff09;&#xff0c;作为全球首个真正用户可用的视频生成大模型&#xff0c;自面世以来&#xff0c;凭借其无与伦比的视频生成效果&#xff0c;在全球范围内赢得了用户的热烈追捧与高度评价。截至目前&#xff0c;申请体验其内…

修正版头像上传组件

修正版头像上传组件 文章说明核心源码展示运行效果展示源码下载 文章说明 在头像剪切上传一文中&#xff0c;我采用div做裁剪效果&#xff0c;感觉会有一些小问题&#xff0c;在昨天基于canvas绘制的功能中改进了一版&#xff0c;让代码变得更简洁&#xff0c;而且通用性相对高…

【WebGIS】从设计层面设计系统

本项目在通过现代信息技术手段&#xff0c;对古村古镇进行多方位、多角度的数字化记录、展示与传播&#xff0c;实现文化遗产的数字化保护、活化利用与共享。项目内容主要包括&#xff1a;1&#xff09;古村古镇数据库的建立&#xff1a;通过多种渠道收集古村古镇的各类信息&am…

如何从 PDF 中删除背景

您是否曾经收到过充满分散注意力背景的扫描 PDF 文档&#xff1f;也许是带有繁忙水印的旧收据或背景光线不均匀的扫描文档。虽然这些背景可能看起来没什么大不了的&#xff0c;但它们会使您的工作空间变得混乱&#xff0c;并使您难以专注于重要信息。轻松删除这些不需要的元素并…

短视频SEO矩阵系统:源码开发与部署全攻略

在数字化时代&#xff0c;短视频已成为人们获取信息、娱乐休闲的重要方式。随着短视频平台的兴起&#xff0c;如何让自己的内容在众多视频中脱颖而出&#xff0c;成为每个创作者和内容运营者关注的焦点。本文将为您深入解析短视频SEO矩阵系统的源码开发与部署&#xff0c;助您在…

MT6825磁编码IC在智能双旋机器人中的应用

MT6825磁编码IC在智能双旋机器人中的应用&#xff0c;无疑为这一领域的创新和发展注入了新的活力。作为一款高性能的磁性位置传感器&#xff0c;MT6825以其独特的优势&#xff0c;在智能双旋机器人的运动控制、定位精度以及系统稳定性等方面发挥了关键作用。 www.abitions.com …

Midjourney v6.5 可能会在“7月底”发布,并改进了真实感和皮肤纹理

Midjourney v6.5即将发布&#xff0c;这一更新将大幅提升图像的真实感和皮肤纹理&#xff0c;为用户带来更逼真的视觉体验。首席执行官David Holz在电话会议中宣布&#xff0c;新版本将提高图像清晰度&#xff0c;特别是在手部和皮肤细节上&#xff0c;同时改进Web应用程序和个…

ABAP调用BAPI时COMMIT WORK AND WAIT未按照预期同步提交问题分析

背景&#xff1a; 在做ABAP开发时&#xff0c;经常会有连续调用BAPI的需求&#xff0c;比如先创建销售订单&#xff0c;再依据销售订单创建交货单&#xff0c;再对交货单进行过账等类似的一连串调用&#xff0c;这种类似的场景往往需要前一步操作的数据完全写入数据库才能进行…

编译打包自己的云手机(redroid)镜像

前言 香橙派上跑云手机可以看之前的文章&#xff1a; 香橙派5plus上跑云手机方案一 redroid(带硬件加速)香橙派5plus上跑云手机方案二 waydroid 还有一个cuttlefish方案没说&#xff0c;后面再研究&#xff0c;cuttlefish的优势在于可以自定义内核且selinux是开启的&#xf…

Aop切面编程(2)--代理模式

1、代理模式的理解&#xff1a;不修改A对象的代码的基础上&#xff0c;对A代码块进行拓展。通过创建ProxyA代理对象&#xff0c;拓展A对象并调用A对象的核心功能&#xff1b; 即&#xff1a;不修改对象的源码基础上&#xff0c;创建代理对象&#xff0c;进行功能的附加和增强&…

端到端拥塞控制的本质

昨天整理了一篇 bbr 的微分方程组建模(参见 bbr 建模)&#xff0c;算是 bbr 算法终极意义上的一个总结&#xff0c;最后也顺带了对 aimd 的描述&#xff0c;算是我最近比较满意的一篇分享了。那么接下来的问题&#xff0c;脱离出具体算法&#xff0c;上升到宏观层面&#xff0c…

uniapp微信小程序 TypeError: $refs[ref].push is not a function

我的写法 this.$refs.addPopup.open();报错 打印出来是这样的 解决 参考未整理 原因 在当前页面使用的v-for循环 并且循环体内也有组件使用了ref&#xff08;而我没有把每个ref做区别命名&#xff09; 这样就导致了我有很多同名的ref&#xff0c;然后就报错了 解决办法&a…

AI人工智能作词,为音乐注入未来之力

在当今的音乐世界中&#xff0c;创新的力量不断推动着边界的拓展&#xff0c;而人工智能作词正以其独特的魅力&#xff0c;成为引领音乐走向未来的强大动力。 “妙笔生词智能写歌词软件&#xff08;veve522&#xff09;”无疑是这股浪潮中的璀璨明星。它利用先进的人工智能技术…

input上传--upload

1.HTML <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>上传文件</title><link rel"…

数据结构——线性表(C语言实现)

写在前面&#xff1a; 在前面C语言的结构体学习中&#xff0c;我提及了链表的操作&#xff0c; 学习数据结构我认为还是需要对C语言的数组、函数、指针、结构体有一定的了解&#xff0c;不然对于结构体的代码可能很难理解&#xff0c;特别是一些书籍上面用的还是伪代码&#xf…

OpenGL笔记一之基础窗体搭建以及事件响应

OpenGL笔记一之基础窗体搭建以及事件响应 总结自bilibili赵新政老师的教程 code review! 文章目录 OpenGL笔记一之基础窗体搭建以及事件响应1.运行2.目录结构3.main.cpp4.CMakeList.txt 1.运行 2.目录结构 01_GLFW_WINDOW/ ├── CMakeLists.txt ├── glad.c ├── main…

Linux基于centos7指令初学3

date指令 作用&#xff1a; date指令可以查看时间 这个指令可以进行格式化 格式&#xff1a;date %想要的内容 Y&#xff1a;年份 m&#xff1a;月份 d&#xff1a;日 H&#xff1a;时 M&#xff1a;分 S&#xff1a;秒 时间分界线可以由…

LabVIEW比例压力控制阀自动测试系统

开发了一套基于LabVIEW编程和PLC控制的比例控制阀自动测试系统。该系统能够实现共轨管稳定的超高压供给&#xff0c;自动完成比例压力控制阀的耐久测试、流量滞环测试及压力-流量测试。该系统操作简便&#xff0c;具有高精度和高可靠性&#xff0c;完全满足企业对自动化测试的需…

安装jenkins最新版本初始化配置及使用JDK1.8构建项目详细讲解

导读 1.安装1.1.相关网址1.2.准备环境1.3.下载安装 2. 配置jenkins2.1.安装插件2.2.配置全局工具2.3.系统配置 3. 使用3.1.配置job3.2.构建 提示&#xff1a;如果只想看如何使用jdk1.8构建项目&#xff0c;直接看3.1即可。 1.安装 1.1.相关网址 Jenkins官网&#xff1a;https…