Chest X-ray Image Classification: A Causal Perspective
摘要
这篇论文提出了一种新的方法来处理胸部X射线(CXR)分类问题,将因果推理融入到基于深度学习的方法中。尽管近年来深度学习在CXR分类方面取得了许多进展,但确保这些算法真正捕捉到疾病与其潜在原因之间的因果关系,而不仅仅是学习将标签映射到图像上,仍然是一个挑战。
为了解决这个问题,作者提出了一种因果方法,涉及构建结构性因果模型(SCM)并利用反向调整来选择与CXR分类相关的视觉信息。具体而言,他们设计了各种概率优化函数,以消除混淆因素对真实因果关系学习的影响。
代码地址
本文方法
图1显示了NIH数据集中一些困难的情况。每一列都是相同的CXR图像,从上到下每一行依次显示了带有病理性边界框的原始图像、传统CNN-based深度学习的加权热图以及我们的方法。四种困难情况如下:(a):图像上的文字,(b):图像不规则,(c):图像上有医疗设备,(d):在类别之间容易混淆。
图2显示了用于CXR图像分类的结构性因果模型(SCM)。“D”是输入数据,“C”表示混淆特征,“X”是因果特征,“Y”是预测结果。混淆因素可以阻止因果变量之间的反向路径,因此在调整后,路径被阻止,如右侧所示。
图3显示了网络的概述。首先,应用具有修改后的注意力机制的CNN来提取图像特征,其中Conv n中的n表示卷积操作的核大小,“+”、“×”和“C”分别表示加法、乘法和连接操作。“GAP”表示全局平均池化,“RS”是随机采样操作,“Cls”表示分类器。transformer解码器内部的交叉注意力模块分开了因果和混淆特征,然后我们可以应用参数化反向调整来实现因果推断。
有监督损失函数:
混淆损失函数
因果推断
实验结果