提出了一种基于深度学习的组织病理学图像分类新方法。我们的方法建立在标准卷积神经网络 (CNN) 的基础上,并结合了两个独立的注意力模块,以实现更有效的特征学习。
具体而言,注意力模块沿不同维度推断注意力图,这有助于将 CNN 聚焦于关键图像区域,并突出显示判别性特征通道,同时抑制与分类任务无关的信息。注意力模块是轻量级的,并且以较小的额外计算开销增强了特征表示。
1. 介绍
使用组织活检的显微镜组织病理学检查已广泛应用于癌症诊断,并在实践中被视为确诊金标准。诊断报告(包括分级和分期)通常由经验丰富的病理学家通过目视检查组织学样本完成。随着图像处理技术的最新进展,这种组织病理学分析的自动化变得越来越可能,从而帮助病理学家提高工作效率和客观性。作为一项基本任务,组织病理学图像的分类近年来备受关注。然而,由于组织病理学图像固有的复杂视觉模式,这种分类任务相当具有挑战性。
早期的组织病理学图像分类研究主要依赖于从整个图像或分割块中提取的手工特征 。虽然手工特征具有可解释性,但由于对图像的描述有限,因此通常无法满足此任务的要求。
利用卷积神经网络 (CNN) 进行自动图像特征学习,结果表明该方法比手工设计的性能更好。然而,基于 CNN 的模型的一个主要弱点是它们通常需要大量数据进行训练。为了缓解数据密集型问题,一种常见的策略是对在大型图像数据集(例如 ImageNet)上预训练的模型进行微调。另一类不同的方法只是利用预训练的 CNN 作为特征提取器,然后应用 Fisher 向量 (FV) 编码进行全局特征表示。这些方法在取得最佳效果的同时,往往会产生冗余和噪声的特征,不利于分类。
1.1 主要贡献
提出了一种新的 CNN 架构,并从不同的角度改进了组织病理学图像(斑块)分类的特征表示。我们方法的核心是注意力机制,它可以帮助 CNN 专注于对分类任务至关重要的区域和特征通道。
主要动机来自人类的视觉系统:当感知场景时,人类首先会瞥一眼该场景,然后立即关注显著内容,而忽略不相关的信息。通过全局特征相关性分析实现了注意力图等机制。具体而言,受 Transformer 和非局部神经网络 [11] 的启发,我们设计了两个注意力模块,分别沿通道和空间维度推断注意力图。
通道注意力(C-Attn)模块允许网络专注于判别特征通道并减少冗余,而空间注意力(S-Attn)模块突出显示有用区域并抑制与网络无关的区域。这两个模块协同增强了判别学习能力,并且可以即插即用的方式集成到任意现有的 CNN 架构中。
在实践中,我们采用 VGG19 [12] 作为基础模型,并在不同位置插入注意模块,如图所示。我们将我们的方法应用于良性和恶性乳腺癌分类任务,并在公开的 BreakHis 数据集 [2] 上证明了我们的方法与最先进的方法相比的优越性。
2. 方法
给定一个中间特征图 作为输入(C、H 和 W 分别是 F 的通道数、高度和宽度),C-Attn 和 S-Attn 模块分别沿通道和空间维度推断注意力图 和