结合外部潜在注意的医学图像分割
摘要
注意机制是提高医学图像分割性能的新切入点。如何合理分配权重是注意力机制的关键,目前流行的方法包括全局压缩和使用自注意操作的非局部信息交互。然而,这些方法过于关注外部特征,缺乏对潜在特征的开发。全局压缩方法通过全局均值或最大值粗略地表示上下文信息的丰富度,而非局部信息交互则侧重于不同区域之间外部特征的相似性。两者都忽略了这样一个事实,即上下文信息更多地以潜在特征(如数据中的频率变化)的形式呈现。为了解决上述问题,并在医学图像分割中合理利用注意机制,我们提出了一种外部-潜在注意协同引导图像分割网络TransGuider。该网络由三个关键部分组成:1)潜在注意模块,该模块使用改进的熵量化方法来准确地探索和定位潜在上下文信息的分布。2)采用稀疏表示的外部自关注模块,通过选择具有代表性的特征描述图进行SA操作,在保留外部全局上下文信息的同时减少计算开销。3)多注意力协同模块,引导网络持续关注感兴趣区域,细化分割掩码。我们在几个基准医学图像分割数据集上的实验结果表明,TransGuider优于最先进的方法,广泛的消融实验证明了所提出组件的有效性。我们的代码可以在https://github.com/chasingone/TransGuider上找到。
1 介绍
我们的贡献可以总结如下:
•我们提出了一种新的通道注意机制,该机制使用改进的信息熵计算方法捕获潜在特征来衡量数据中包含的上下文信息的丰富程度,可以准确地激活有效的上下文信息并抑制无效的上下文信息。
•我们建议对原始数据进行稀疏化操作,获得外部特征描述图,取代原始数据进行自关注操作,减少计算开销。
•我们提出了一种新的图像分割网络结构,称为TransGuider,其中构建的注意力协同引导块(Attention Collaborative Guidance Block, ACG)起着重要作用。TransGuider在多个医学图像基准数据集上实现了最先进的性能。
3 方法
在本节中,我们首先介绍了transguide医学图像分割网络的整体框架。然后,在不同的小节中详细描述了TransGuider的关键组件(LECA, ESRA和ACG)。
图2所示。概述提出的transguide医学图像分割网络。它由9个编码和解码阶段组成,每个阶段都使用混合变压器块。在相邻阶段之间使用池化和恢复块来缩小和扩展特征映射。在相应的编码和解码阶段之间添加LECA以增强语义表示。