文献速递:肿瘤分割---- ALA-Net:用于3D结直肠肿瘤分割的自适应病变感知注意力网络

文献速递:肿瘤分割---- ALA-Net:用于3D结直肠肿瘤分割的自适应病变感知注意力网络

01

文献速递介绍

结直肠癌(CRC)在全球范围内与高发病率和死亡率相关,。肿瘤的预后高度依赖于诊断时疾病的阶段。准确检测和分割肿瘤及其周围的结直肠组织对于促进病理分期的预测和指导适当治疗至关重要。在临床常规中,癌变区域是在磁共振(MR)图像上手动识别和描绘的。然而,在大量MR图像上进行手动标记和描绘是一项繁琐、易出错且依赖操作者的任务。因此,开发一种准确和自动的结直肠肿瘤分割技术是非常必要的。尽管以前对这一主题进行了大量研究,但这项任务仍然困难,原因在于对比度差、各向异性空间分辨率、强度不均匀、缺乏先验信息和类别不平衡等因素。此外,结直肠肿瘤具有特征性的模糊边界,并在形状、大小和结构上表现出显著变化,这进一步增加了它们完全自动分割的难度。基于信心连接区域生长算法或超体素聚类的传统结直肠肿瘤分割方法在需要精确肿瘤边界的情况下是不足够的。这些算法容易受到噪声的影响,通常需要手动干预。目前,深度卷积神经网络(DCNNs)在医学图像分割任务中取得了显著成功。这是因为它们能够直接从数据中学习逐渐复杂的特征表示层次。然而,重复组合的池化和下采样层,使模型获得对空间变换的不变性,本质上导致了细节和位置信息的丢失,从而限制了定位的准确性。

Title

题目

ALA-Net: Adaptive Lesion-Aware Attention Network for 3D Colorectal Tumor Segmentation

ALA-Net:用于3D结直肠肿瘤分割的自适应病变感知注意力网络

Abstract

摘要

Accurate and reliable segmentation of colorectal tumors and surrounding colorectal tissues on 3D magnetic resonance images has critical importance in preoperative prediction, staging, and radiotherapy. Previous works simply combine multilevel features without aggregating representative semantic information and without compensating for the loss of spatial information caused by down-sampling. Therefore, they are vulnerable to noise from complex backgrounds and suffer from misclassification and target incompleteness-related failures. In this paper, we address these limitations with a novel adaptive lesion-aware attention network (ALA-Net) which explicitly integrates useful contextual information with spatial details and captures richer feature dependencies based on 3D attention mechanisms. The model comprises two parallel encoding paths. One of these is designed to explore global contextual features and enlarge the receptive field using a recurrent strategy. The other captures sharper object boundaries and the details of small objects that are lost in repeated down-sampling layers. Our lesion-aware attention module adaptively captures long-range semantic dependencies and highlights the most discriminative features, improving semantic consistency and completeness. Furthermore, we introduce a prediction aggregation module to combine multiscale feature maps and to further filter out irrelevant information for precise voxel-wise prediction.

精确可靠地在3D磁共振图像上分割结直肠肿瘤及其周围结直肠组织对于术前预测、分期和放疗至关重要。之前的研究仅简单地结合多层次特征,没有聚合有代表性的语义信息,也没有补偿下采样造成的空间信息损失。因此,它们容易受到复杂背景噪声的影响,并遭受误分类和目标不完整性相关的失败。在本文中,我们通过一个新颖的自适应病变感知注意力网络(ALA-Net)来解决这些限制,该网络明确地将有用的上下文信息与空间细节整合,并基于3D注意力机制捕获更丰富的特征依赖性。该模型包括两个并行的编码路径。其中一个旨在通过循环策略探索全局上下文特征并扩大感受野。另一个捕获更清晰的对象边界和在重复下采样层中丢失的小对象细节。我们的病变感知注意力模块能够自适应地捕获长范围语义依赖性,并突出最具辨别性的特征,提高语义一致性和完整性。此外,我们引入了一个预测聚合模块,用于组合多尺度特征图,并进一步过滤掉不相关信息,以实现精确的体素级预测。

Methods

方法

The architecture of our ALA-Net is illustrated in Fig. 1. We first feed input into a GCE, which captures rich context information at four different resolution stages. To compensate for the inevitable loss of spatial information caused by down-sampling operations in the GCE, we also feed input into a DSRP which probes spatial features to recover details of local features. We concatenate feature maps from GCE and DSRP at each resolution stage and perform trilinear interpolation followed by convolution operations to accomplish feature refinement. This refinement processing is conducive to enhancing the network’s ability to handle small objects and reconstruct lost boundary details. We denote up-sampled features at multiple scales as Fs, where s indicates the resolution stage in the architecture. Subsequently, Fs from all scales are concatenated to form FM L , which encodes low-level fine-grained features from shallow layers and high-level semantics fromdeeper layers. We combine FM L with each Fs and feed them into the proposed LAMs to generate attentive features. Finally, we fuse the multiple attentive feature maps by a PAM to obtain segmentation results. The following subsections present the details of each network component and elaborate on the motivations behind them.

我们的ALA-Net架构如图1所示。我们首先将输入送入GCE,该GCE在四个不同的分辨率阶段捕获丰富的上下文信息。为了弥补GCE中下采样操作不可避免地造成的空间信息丢失,我们还将输入送入DSRP,该DSRP探测空间特征以恢复局部特征的细节。我们在每个分辨率阶段将GCE和DSRP的特征图进行串联,并执行三线性插值,随后进行卷积操作以完成特征细化。这种细化处理有助于增强网络处理小物体和重构丢失边界细节的能力。我们将架构中各分辨率阶段的上采样特征表示为Fs,其中s表示分辨率阶段。随后,所有尺度的Fs被串联形成FM L ,它从浅层编码低级细腻特征和从深层编码高级语义。我们将FM L 与每个Fs结合,并将它们送入所提出的LAMs以生成注意力特征。最后,我们通过PAM融合多个注意力特征图以获得分割结果。以下小节将介绍每个网络组件的细节,并阐述其背后的动机。

Conclusions

结论

We proposed ALA-Net, a novel architecture based on the attention mechanism for fully automatic, whole volume colorectal tumor segmentation. Our approach yields an effective and efficient scheme which leverages multiscale contextual information and recovers fine-grained spatial information lost in down-sampling layers in order to refine the learned feature representation. Our key idea is to allow the network to concentrate on semantically salient regions and to select features beneficial to the recovery of lesions by using the attention mechanism. Experimental results on a large quantity of challenging pelvic volumes show that ALA-Net outperforms 2D, 3D, and hybrid 2D-3D state-of-the-art methods. We also conducted extensive ablation experiments to evaluate the impact of the individual network components and further motivate our design choices. Our results demonstrate the effectiveness of our approach in providing precise and reliable automatic segmentation of colorectal tumors and surrounding normal tissues. The segmentation results of tumors and of surrounding colorectal tissues reveal how deeply the primary tumor has grown into the bowel lining, providing oncologists with accurate information to help determine the tumor stage. In our future work, we will work on reliable, efficient, weakly supervised deep learning models for colorectal tumor segmentation, as the delineation procedure is laborious and timeconsuming. Furthermore, we will explore the postprocessing module using GANs to refine the outputs.

我们提出了ALA-Net,这是一种基于注意力机制的全新架构,用于结直肠肿瘤的全自动、全体积分割。我们的方法提供了一个有效且高效的方案,它利用多尺度上下文信息并恢复在下采样层中丢失的细腻空间信息,以精炼学习到的特征表示。我们的核心思想是让网络集中注意力于语义上显著的区域,并选择对恢复病变有益的特征,通过使用注意力机制实现这一点。在大量具有挑战性的盆腔体积上的实验结果显示,ALA-Net优于2D、3D和混合2D-3D的最先进方法。我们还进行了广泛的消融实验,以评估各个网络组件的影响,并进一步激励我们的设计选择。我们的结果展示了我们的方法在提供精确可靠的结直肠肿瘤及其周围正常组织的自动分割方面的有效性。肿瘤及其周围结直肠组织的分割结果揭示了原发性肿瘤在肠道内膜中的深度生长情况,为肿瘤分期提供了精确信息,以帮助肿瘤学家确定肿瘤阶段。在未来的工作中,我们将致力于可靠、高效的弱监督深度学习模型,用于结直肠肿瘤分割,因为勾画程序是费时且繁琐的。此外,我们还将探索使用GANs来细化输出的后处理模块。

Figure

图片

Fig. 1. Schematic of ALA-Net. GCE: global context encoder; WRRB: wide recurrent residual block; RM: reduction module; DSRP: dense spatial refinement path; WSB: weighted dense block; TL: transition layer; H3DC: hybrid 3D dilated convolution; Fs: up-sampled features from multiple resolution stages; FML: combined features from multiple layers; LAM: lesion-aware attention module; PAM: prediction aggregation module. AFs: attentive features from four LAMs. 2×up and 4×up denote trilinear up-sampling by a factor of two and four, respectively.

图1。ALA-Net示意图。GCE:全局上下文编码器;WRRB:宽循环残差块;RM:降维模块;DSRP:密集空间细化路径;WSB:加权密集块;TL:过渡层;H3DC:混合3D膨胀卷积;Fs:来自多个分辨率阶段的上采样特征;FML:来自多层的组合特征;LAM:病变感知注意力模块;PAM:预测聚合模块。AFs:来自四个LAM的注意力特征。2×up和4×up分别表示通过两倍和四倍的因子进行三线性上采样。

图片

Fig. 2. Structure of WRRB and reduction module. (a) Components in a WRRB, consisting of three branches. (b) Unfolded RCL for T = 2. The effective receptive field of an RCL unit expands when the iteration number t increases. © Components in a reduction module

图2。WRRB和降维模块的结构。(a) WRRB中的组件,由三个分支组成。(b) 当T = 2时展开的RCL。当迭代次数t增加时,RCL单元的有效接收场会扩大。© 降维模块中的组件。

图片

Fig. 3. Illustration of hybrid 3D dilated convolution strategy. r denotes the dilatedrate, representing inserting r − 1 zeros between two consecutive filter values along each spatial dimension. The first H3DC adopts r = 1, 2, 3, whereas the second adopts r = 3, 4, 5. In each H3DC, the applied dilation rates do not have a common factor relationship according to [25]

图3。混合3D膨胀卷积策略的示意图。r表示膨胀率,代表在每个空间维度上两个连续滤波器值之间插入r − 1个零。第一个H3DC采用r = 1, 2, 3,而第二个采用r = 3, 4, 5。在每个H3DC中,根据[25]的说法,应用的膨胀率没有公因数关系。

图片

Fig. 4. Weighted dense block. αl denotes the attention score for each direct connection starting from lth layer. F · denotes the combination of instance normalization (IN), rectified linear units (ReLU) and 3D convolution. At the end of each WSB, we apply a dropout layer with the dropout rate of 0.2 to avoid overfitting.

图4。加权密集块。αl表示从第l层开始的每个直接连接的注意力得分。F · 代表实例归一化(IN)、整流线性单元(ReLU)和3D卷积的组合。在每个WSB的末端,我们应用一个dropout率为0.2的dropout层以避免过拟合。

图片

Fig. 5. Lesion-aware attention module. E: input feature maps; O: output feature maps; R: spatial attention map; X: channel attention map.

图5。病变感知注意力模块。E:输入特征图;O:输出特征图;R:空间注意力图;X:通道注意力图。

图片

Fig. 6. Prediction aggregation module. AF0, AF1, AF2, and AF3 are the multilevel attentive features from four LAMs. After 1 × 1 × 1 convolution, these feature maps are combined by element-wise sum operation, generating AFl . AFmax l and AFavg l denote average-pooled features and max-pooled features, respectively. To reduce parameter overhead, we reduce the channel numbers of Fmax l and F avg l to a quarter of the original size. Ml denotes the attention map that generates the weights along the channel dimension.

图6。预测聚合模块。AF0,AF1,AF2和AF3是来自四个LAM的多级注意力特征。经过1×1×1卷积后,这些特征图通过元素级求和操作结合起来,生成AFl。AFmax l 和AFavg l分别表示平均池化特征和最大池化特征。为了减少参数开销,我们将Fmax l 和Favg l的通道数减少到原来大小的四分之一。Ml表示沿通道维度生成权重的注意力图。

图片

Fig. 7. Qualitative results. Colorectal tumor (red); Surrounding normal colorectal tissues (green)

图7。定性结果。结直肠肿瘤(红色);周围正常结直肠组织(绿色)

图片

Fig. 8. Visualization results of the feature maps. For each row, we show an input image, the corresponding feature maps from the outputs of GCE, DSRP, and LAM at the fourth resolution stage, and feature maps from the outputs of PAM and the ground truth.

图8。特征图的可视化结果。对于每一行,我们展示了一张输入图像,以及来自第四分辨率阶段的GCE、DSRP和LAM输出的相应特征图,以及来自PAM输出的特征图和真实标签。

图片

Fig. 9. Variants of DSRP. The difference between these three options is the number of transition layers (TL) and the ratio of the final output feature map size to the original input size

图9。DSRP的变体。这三种选项之间的区别在于过渡层(TL)的数量以及最终输出特征图尺寸与原始输入尺寸的比率。

图片

Fig. 10. Qualitative results on public datasets. The first and second rows show results on the lung segmentation dataset. The third to fifth rows show results on the LiTS challenge, where the liver is depicted in green and the tumors are depicted in red. Our method consistently performs well on the two public datasets.

图10。公共数据集上的定性结果。第一行和第二行展示了肺部分割数据集的结果。第三行到第五行展示了LiTS挑战的结果,其中肝脏以绿色表示,肿瘤以红色表示。我们的方法在这两个公共数据集上表现一致良好。

Table

图片

table 1 ablation study on indixidual contribution of different modules in the ten-foldcross-validation process(MEAN ± S.D.)

表I 十折交叉验证过程中不同模块单独贡献的消融研究(均值 ± 标准差)

图片

TABLE II comparison between modules and their close alterna tives in the ten-fold cross-validation process(MEAN ± S.D.)

表II 十折交叉验证过程中模块及其近似替代品的比较(均值 ± 标准差)

图片

TABLE III comparison to other state-of-the-art architectures(MEAN ± S.D.)

表III 与其他最先进架构的比较(均值 ± 标准差)

图片

TABLE IVevaluations of using different numbers of transition layers(TL).we use 2 transition layers in dsrp throughout all experiments forementioned in the paper because this turns out to be the best compromise between accuracy and efficiency.note that the configuration of none transition layer is ignored due to the memory limitation.ratio=(OUTPUT SIZE / ORIGINAL INPUT)

表IV 使用不同数量过渡层(TL)的评估。在本文中提到的所有实验中,我们在DSRP中使用2个过渡层,因为这被证明是在准确性和效率之间的最佳折衷。请注意,由于内存限制,没有过渡层的配置被忽略。比率 =(输出尺寸 / 原始输入)

图片

TABLE V evaluations of using different numbers of dense spatial refinent paths (DSRPS). we use 1 dsrp throughout all experiments forementioned in the paper because this turns out to be the best choice

表V 使用不同数量密集空间细化路径(DSRPs)的评估。在本文中提到的所有实验中,我们使用1个DSRP,因为这被证明是最佳选择。

图片

TABLE VI comparison to other state-of-the-art Architectures on independent test set

表VI 在独立测试集上与其他最先进架构的比较

图片

TABLE VII segmentation results on lung segmentation dataset

表VII 肺部分割数据集上的分割结果

图片

TABLE VIII segmentation results on lits dataset

表VIII LiTS数据集上的分割结果

图片

TABLE IX evaluations of model complexity,showing the parameters of different models

表IX 模型复杂度评估,展示了不同模型的参数情况

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/669040.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

不需英文基础也可以轻松学编程,中文编程开发工具免费版下载,编程工具构件箱之扩展控制面板构件用法

不需英文基础也可以轻松学编程,中文编程开发工具免费版下载,编程工具构件箱之扩展控制面板构件用法 一、前言 编程入门视频教程链接 https://edu.csdn.net/course/detail/39036 编程工具及实例源码文件下载可以点击最下方官网卡片——软件下载——常…

1-3 动手学深度学习v2-线性回归的从零开始实现-笔记

手动创建训练数据集 根据带有噪声的线性模型构造一个人造数据集。我们使用线性模型参数 w [ 2 , − 3.4 ] T \pmb{w} [2,-3.4]^{T} w[2,−3.4]T、 b 4.2 b 4.2 b4.2和噪声项 ϵ \epsilon ϵ生成数据集及其标签: y X w b ϵ \pmb{y} \pmb{Xw}b\epsilon yXw…

2024年【化工自动化控制仪表】考试题及化工自动化控制仪表最新解析

题库来源:安全生产模拟考试一点通公众号小程序 2024年化工自动化控制仪表考试题为正在备考化工自动化控制仪表操作证的学员准备的理论考试专题,每个月更新的化工自动化控制仪表最新解析祝您顺利通过化工自动化控制仪表考试。 1、【单选题】()指用多个相…

spring-security authentication persistence

翻译版本【spring-security 6.2.1】persistence Persisting Authentication 用户第一次请求受保护的资源时,系统会提示他们输入凭据。提示输入凭据的最常见方法之一是将用户重定向到登录页面。未经身份验证的用户请求受保护的资源的HTTP交换可能如下所示: 例1。未…

关于Linux和消息队列常见的十道面试题

实际工作中如何排查CPU飙升问题? 在实际工作中,我们可以通过以下步骤来排查CPU飙升的问题: 使用系统监控工具:首先,我们可以使用系统监控工具,如top命令,来查看所有进程占系统CPU的排序。这样可…

UML---用例图,类图

用例图 用例图(Use Case Diagram)主要描述系统的功能需求和参与者与系统之间的交互。它是用户与系统交互的最简表示形式,展现了用户和与他相关的用例之间的关系。用例图被视为系统的蓝图,通过它,人们可以获知系统不同种…

mysql:事务的特性ACID、并发事务(脏读、不可重复读、幻读、如何解决、隔离级别)、undo log和redo log的区别、相关面试题和答案

事务是一组操作的集合,它会把所有的操作作为一个整体一起向系统提交或撤销操作请求,即这些操作要么同时成功,要么同时失败。 事务的特性(ACID) 原子性(Atomicity):事务是不可分割的…

idea开发工具的简单使用与常见问题

1、配置git 选择左上角目录file->setting 打开,Version Control 目录下Git,选择git安装目录下的git.exe文件; 点击test,出现git版本,则表示git识别成功,点击右下角确认即可生效。 2、配置node.js 选…

ubuntu开机报错/dev/nume0n1p2:clean

本来是开机卡在这个界面,经过以下操作,变成这种了 现在的问题变成linux卡在 failed to start NVIDIA Persistence Daemon 按照下面的操作方法,可以有开机界面了。但是输入密码后,一直在登录界面 1.方式一:重新安装显…

TypeScript 学习笔记(Day4)

「写在前面」 本文为 b 站黑马程序员 TypeScript 教程的学习笔记。本着自己学习、分享他人的态度,分享学习笔记,希望能对大家有所帮助。推荐先按顺序阅读往期内容: 1. TypeScript 学习笔记(Day1) 2. TypeScript 学习笔…

【计算机网络】Socket的SO_TIMEOUT与连接超时时间

SO_TIMEOUT选项是Socket的一个选项,用于设置读取数据的超时时间。它指定了在读取数据时等待的最长时间,如果在指定的时间内没有数据可读取,将抛出SocketTimeoutException异常。 SO_TIMEOUT的设置 默认情况下,SO_TIMEOUT选项的值…

SystemVerilog约束随机(二)

文章目录 前言一、SystemVerilog约束随机1.1 集合操作set membership1.2 权重约束weighted constraints1.3 队列约束array constranint1.4 条件约束order constraints1.5 等价约束equivalence constraints1.6 顺序约束solver order 总结 前言 这里主要记录一下systemverilog中…

【Rust】——rust前言与安装rust

🎃个人专栏: 🐬 算法设计与分析:算法设计与分析_IT闫的博客-CSDN博客 🐳Java基础:Java基础_IT闫的博客-CSDN博客 🐋c语言:c语言_IT闫的博客-CSDN博客 🐟MySQL&#xff1a…

ACM训练题:Division

题意是给你N&#xff0c;打印出所有相除等于N的五位数&#xff08;包含前导零&#xff09;&#xff0c;可以枚举后五位&#xff0c;计算量是10&#xff01;/5&#xff01;&#xff0c;然后乘N&#xff0c;一起检验10个数是否都出现。 AC代码&#xff1a; #include <iostre…

蓝桥杯省赛无忧 课件111 带权并查集

01 什么是带权并查集&#xff1f; 02 算法原理 03 经典例题分析

uniapp踩坑之项目:简易版不同角色显示不一样的tabbar和页面

1. pages下创建三个不同用户身份的“我的”页面。 显示第几个tabbar&#xff0c;0是管理员 1是财务 2是司机 2. 在uni_modules文件夹创建底部导航cc-myTabbar文件夹&#xff0c;在cc-myTabbar文件夹创建components文件夹&#xff0c;在components文件夹创建cc-myTabbar.vue组件…

五、MyBatis 高级扩展

本章概要 Mapper 批量映射优化插件和分页插件 PageHelper 插件机制和 PageHelper 插件介绍PageHelper 插件使用 逆向工程和 MybatisX 插件 ORM 思维介绍逆向工程逆向工程插件 MyBatisX 使用 5.1 Mapper 批量映射优化 需求 Mapper 配置文件很多时&#xff0c;在全局配置文件…

Spark Shuffle Service简介与测试

一 Dynamic Resource Allocation(动态资源分配) 了解Shuffle Service之前&#xff0c;我们需要先了解和Shuffle Service有关的另一个特性&#xff1a;动态资源分配。 Spark管理资源有两种方式&#xff1a;静态资源分配和动态资源分配。 静态资源分配&#xff1a;spark提交任…

Java并发基础:Phaser全面解析!

内容概要 Phaser是Java中一个灵活的同步工具&#xff0c;其优点在于支持多阶段的任务拆分与同步&#xff0c;并且能够动态地注册与注销参与者&#xff0c;它提供了丰富的等待与推进机制&#xff0c;使得开发者能够更细粒度地控制线程的协调行为&#xff0c;实现复杂的并行任务…