简要总结
这篇文章提出了一种名为CcSi-MHAHGEL的框架,用于基于多站点、多图谱fMRI的功能连接网络(FCN)分析,以辅助自闭症谱系障碍(ASD)的识别。该框架通过多视图超边感知的超图嵌入学习方法,整合多个脑图谱构建的FCN,并引入类别一致性和站点独立性模块,分别优化类间区分度和降低站点偏差。实验结果表明,该方法在ABIDE数据库的ASD诊断任务中优于多种现有方法,并能揭示与ASD相关的脑区,具有较高的可解释性和诊断性能。
摘要
近年来,基于功能磁共振成像(fMRI)的图卷积网络(GCN)的功能连接网络(FCN)分析在脑疾病的自动诊断中显示出了良好的应用前景,它将FCN视为不规则的图结构数据进行处理。然而,在多站点、多图谱fMRI场景中,FCN的多视图信息和站点影响尚未得到充分研究。文章提出了一种名为CcSiMHAHGEL(类别一致性与站点独立性多视图超边感知超图嵌入学习)的框架,用于整合基于多个脑图谱构建的FCN,以进行多站点fMRI研究。具体而言,对于每个受试者,首先为每个脑图谱建模脑网络为超图,以表征多个顶点之间的高阶关系,然后引入一种多视图超边感知的超图卷积网络(HGCN),以提取基于多图谱的FCN嵌入。其中超边权重是自适应学习的,而不是使用传统HGCN中预先计算的固定权重。此外,我们设计了两个模块,分别考虑类别间和站点间的受试者关联,联合学习基于多图谱的FCN嵌入。具体为:类别一致性模块用于增强每个类别内的紧凑性和类别间的分离性,以提高嵌入空间的区分能力;站点独立性模块用于最小化嵌入与站点的依赖性,以减轻因多个站点的扫描平台和/或协议差异导致的偏差。最终,基于多图谱的FCN嵌入被输入到全连接层,再通过softmax分类器进行诊断决策。在ABIDE数据库上的广泛实验表明,我们的方法在识别自闭症谱系障碍(ASD)方面是有效的。此外,我们的方法具有可解释性,能够揭示与ASD相关的生物学上重要的脑区。
图一
1 引言
在过去的几十年中,基于功能磁共振成像(fMRI)的功能连接网络(FCN)或功能连接组已被广泛研究,以发现用于自动诊断精神和神经疾病的潜在神经影像学生物标志物,例如自闭症、精神分裂症和抑郁症。与传统的基于症状的主观诊断标准相比,FCN提供了一种客观、可靠且无创的诊断手段,用于检查这些脑部疾病背后的病理生理机制。具体来说,FCN自然地被描述为一个图结构,其中顶点代表空间分布但功能上相互连接的感兴趣脑区(ROIs),而边则表示ROIs之间的功能连接(FC),通过成对ROIs的血氧水平依赖(BOLD)时间序列之间的依赖性来量化。在全脑水平上,功能连接的异常可能构成与疾病相关的生物标志物特征。
近年来,大量机器学习和深度学习模型引起了对功能连接网络(FCN)分析的广泛关注,用于脑部疾病的自动诊断。例如,支持向量机(SVM)被用于区分多系统萎缩症和帕金森病,逻辑回归被用于阿尔茨海默病的早期检测,深度神经网络(DNNs)被用于精神分裂症的识别,以及其他相关研究。然而,FCN作为一个包含所有功能连接(FCs)的矩阵,通常被直接向量化后输入到上述模型中,这导致了脑区(ROIs)之间重要的拓扑结构信息被忽视。为了揭示脑网络中的区分性模式,FCN应该被视为不规则的图结构数据,并作为一个整体输入到诊断模型中,其中每个脑区代表一个顶点,其相关的功能连接(FC)特征作为顶点的属性。
鉴于图卷积网络(GCN)能够很好地处理不规则图结构,并通过图卷积传播相邻顶点的特征,基于GCN的模型在学习FCN特征表示(即FCN嵌入)方面取得了更大的成功,并因此提高了对脑部疾病的诊断性能。Cui等人已经对基于GCN的脑网络分析进行了系统研究,并提供了模型、示例以及现成的Python软件包。例如,Ktena等人提出了一个孪生GCN模型,用于学习FCN之间的图相似性度量,以识别自闭症患者与健康对照组。Qin等人研究了一种图嵌入学习(GEL)模型,用于诊断抑郁症,其中首先通过GCN学习FCN嵌入,然后将其输入到由softmax函数激活的全连接层中进行最终分类。此外,Chu等人开发了一种多视图图嵌入学习(MGEL)模型,以利用基于多个图谱构建的FCN的互补信息,从而在下游自闭症诊断中,相比于仅使用单个图谱的FCN,基于多图谱的FCN嵌入表现出了更好的性能。
尽管当前的图卷积网络(GCN)在功能连接网络(FCN)分析中表现出有效性,但在应用于多站点功能性磁共振成像(fMRI)研究时,仍存在三个主要缺陷。首先,在GCN中,顶点特征是沿着简单图上的脑区(ROI)之间的连接进行传播的。然而,脑网络可能比可以通过ROI之间的成对关系完全表示的更为复杂。换句话说,多个(超过两个)ROI之间可能存在复杂的相互作用。其次,在GCN的学习过程中,FCN嵌入是针对每个受试者单独考虑的,未能处理类内和类间的受试者间关联,这种关联可以量化每个类内的紧凑性和类间的分离性。第三,以往大多数基于GCN的多站点FCN研究通常假设来自不同站点的fMRI数据共享相同或相似的分布,然而,由于成像扫描仪和/或扫描协议的差异而导致的站点间异质性常常被忽视。这可能会导致对FCN的有偏建模,从而影响疾病诊断。
为了在多站点功能性磁共振成像(fMRI)研究中利用基于多图谱的功能连接网络(FCN)进行脑部疾病的诊断,提出了一个类别一致性与站点独立性多视图超边感知超图嵌入学习框架,如图2所示。该框架主要包括以下三个部分:首先开发了一个多视图超边感知的超图卷积网络(HGCN),用于整合每个受试者基于多个图谱构建的FCN。为此,通过超边感知的HGCN为每个受试者学习每个图谱对应的FCN嵌入向量,随后结合最大池化和平均池化操作,最终将所有图谱的FCN嵌入向量进行加权拼接,形成基于多图谱的FCN嵌入。这里需要注意的是,将脑网络建模为超图,并采用HGCN而不是传统的图卷积网络(GCN),以捕捉ROI之间更复杂的关系。这是因为超图的边(称为超边)可以连接超过两个顶点(即ROI),这使得HGCN能够在两个层面上同时进行超边内和超边间的顶点特征传播。此外,与传统HGCN在整个超图卷积层中预定义并保持超边权重不变不同,在超边感知的HGCN的每个超图卷积层中自适应学习更灵活的超边权重。此外,引入了两个模块,分别用于联合学习基于多图谱的FCN嵌入,以考虑类间和站点间的受试者关联。具体来说,使用类别一致性模块同时最小化嵌入的类内差异和类间相似性,同时采用站点独立性模块最小化嵌入与采集站点之间的统计依赖性,以减轻其他的站点影响。最后,将学习到的基于多图谱的FCN嵌入输入到几个全连接层,随后通过softmax分类器进行脑部疾病的检测。
图2 CcSi-MHAHGEL框架。首先,将脑网络建模为超图,并通过多视图超边感知的超图卷积网络(HGCN)为每个受试者提取基于多图谱的FCN嵌入。此外,设计了两个附加模块(即类别一致性模块和站点独立性模块),用于联合学习基于多图谱的FCN嵌入,以分别考虑类间和站点间的受试者关联。最终,学习到的基于多图谱的FCN嵌入被输入到全连接层和softmax分类器中
为了验证CcSi-MHAHGEL框架的有效性,在ABIDE数据库中样本量最大的前四个站点的355名受试者(包括167名自闭症谱系障碍(ASD)患者和188名健康对照者)的基于自动化解剖标记(AAL)和哈佛-牛津(HO)图谱的功能连接网络(FCN)上进行了广泛的实验。实验结果表明,CcSi-MHAHGEL在识别ASD方面优于其他几种方法。此外,还在CcSi-MHAHGEL中利用了梯度加权类激活映射(Grad-CAM),以揭示与ASD相关的具有区分性的脑区(ROIs)。
总而言之,文章的贡献有三方面:
提出了一种新颖的多视图超边感知的超图卷积网络(HGCN)基础的功能连接网络(FCN)嵌入学习方法,用于整合在不同空间尺度上基于多个脑图谱构建的FCN。其中,基于多图谱的FCN为脑网络提供了多个视角,并且在每个视角中,脑网络被建模为超图(而非简单图),并且开发了超边感知的HGCN(而非GCN或传统HGCN),以捕捉脑网络中更复杂的信息。
设计了类别一致性模块和站点独立性模块,分别用于处理嵌入空间中类内和类间受试者关联以及站点间的异质性问题。这些模块能够促进学习到的基于多图谱的FCN嵌入在不同类别和站点之间具有更好的区分能力。
在ABIDE数据库的多站点、多图谱fMRI数据上进行的广泛实验表明,CcSi-MHAHGEL框架在自闭症谱系障碍(ASD)识别方面优于其他几种方法。
2 方法
首先回顾超图的概念。与简单图(仅表征顶点之间的成对关系,也称为二阶关系)相比,超图能够表征多个(通常超过两个)顶点之间的高阶关系。在超图中,每条超边可以连接任意数量的顶点,而不仅仅是两个顶点。换句话说,超边是顶点的非空(且不一定是不相交的)子集。通过这种方式,超图能够捕捉到简单图无法揭示的更复杂的结构信息。
文章提出了一个CcSi-MHAHGEL框架,用于整合基于多图谱的功能连接网络(FCNs),以对来自不同站点的脑疾病患者(PTs)和健康对照组(HCs)进行分类,如图2所示。具体而言,我们首先开发了一个多视图超边感知的超图卷积网络(HGCN),为每个受试者提取基于多图谱的FCN嵌入,其中每个视图对应于基于单一图谱的FCN。此外,还设计了两个附加模块,用于联合学习基于多图谱的FCN嵌入,以分别考虑类间和站点间的受试者关联。具体来说,类别一致性模块旨在促进每个类别内的紧凑性和类别间的分离性,以增强嵌入空间中的区分能力;站点独立性模块则用于最小化基于多图谱的FCN嵌入的站点依赖性,以减轻因多个站点的扫描平台和/或协议差异而导致的其他的站点影响。最终,输出的基于多图谱的FCN嵌入被输入到全连接层,随后通过softmax分类器进行脑部疾病的诊断。
为了利用在不同脑图集上构建的多个FSG的补充信息,提出了一种多视图超边感知的超图卷积网络(HGCN),用于提取基于多图谱的FCN嵌入。与传统HGCN不同,该框架中的HGCN能够自适应学习超边权重,而不是使用预定义的固定权重。HGCN通过超边内的顶点特征传播和超边间的交互,捕捉脑网络中复杂的高阶关系。
类别一致性模块旨在增强嵌入空间的类内紧凑性和类间可分性,从而提高基于多图谱的功能连接网络(FCN)嵌入在分类任务中的区分能力。具体来说,该模块通过优化嵌入空间,使得同一类别的样本更加接近,而不同类别的样本更加分离。具体来说,该模块通过以下目标函数实现:最小化类内差异,使同一类别内的嵌入尽可能接近,计算同一类别内样本嵌入的均值,并最小化每个样本嵌入与该类别均值之间的距离。最大化类间差异,使不同类别之间的嵌入尽可能分离。通过最大化不同类别均值之间的距离来实现。
站点独立性模块旨在最小化嵌入与采集站点之间的统计依赖性,从而减轻因不同站点的扫描平台和/或协议差异导致的偏差。这对于提高模型在多站点数据上的泛化能力和稳定性至关重要。站点独立性模块通过以下方式实现其功能:衡量站点依赖性
使用HSIC(Hilbert-Schmidt Independence Criterion)衡量嵌入与站点之间的依赖性。HSIC是一种基于核的统计方法,用于量化两个随机变量之间的独立性。具体来说,HSIC通过计算嵌入向量与站点标签之间的核矩阵来衡量它们之间的依赖性。另一种是最小化依赖性,通过优化过程最小化HSIC值,从而减少嵌入与站点之间的依赖性。
3 结果
3.1 数据集和数据预处理
文章使用的是ABIDE数据库的数据。ABIDE是一个公开的多站点成像数据存储库,包含了来自21个不同站点的自闭症谱系障碍(ASD)患者和健康对照(HC)受试者的结构和功能成像数据。使用了来自样本量最大的前四个站点的静息态功能性磁共振成像(fMRI)数据,这些站点分别是纽约大学(NYU)、密歇根大学(UM)、犹他大学医学院(USM)和耶鲁儿童研究中心(YALE),涵盖了167名ASD患者和188名HC受试者。所选ABIDE受试者的简要总结见表1。
表1 研究中从ABIDE中选择的受试者的人口统计学特征; F:女性,M:男性
文章从ABIDE预处理数据集(http://preprocessed-connectomes-project.org/abide)免费下载了基于静息态功能性磁共振成像数据处理助手(DPARSF)工具箱预处理的静息态fMRI数据,其中也提供了具体的神经影像采集参数和预处理流程。预处理流程主要包括:头动校正、图像配准、将图像归一化到标准的蒙特利尔神经研究所(MNI)空间、使用6毫米全宽半高(FWHM)高斯核进行空间平滑,以及0.01到0.1赫兹的带通滤波。每个大脑被根据两种不同的结构图谱划分为116个和111个感兴趣区(ROIs)。通过计算每对ROIs的BOLD时间序列之间的Fisher z变换的Pearson相关系数,我们为每个受试者得到了两个不同的功能连接网络(FCN)矩阵,每个ROI的BOLD时间序列是通过计算该ROI内所有体素的时间序列的平均值得到的。
3.2 实验设置
通过进行五次10折站点内交叉验证来评估所提出的CcSi-MHAHGEL框架以及与之竞争的方法。对于10折站点内交叉验证,首先将所有受试者整体划分为10个互不相交的折叠(即子集),同时尽量保持每个折叠中站点和诊断组的比例大致相同;然后依次将每个折叠选为测试集,其余9个折叠用作训练集。基于五种最常用的评估指标——准确率、敏感性、精确度、F1分数以及受试者工作特征曲线下面积(AUC)——我们分别报告了所有测试集中分类结果的均值和标准差(sd)。
在CcSi-MHAHGEL框架中,涉及的超参数被最优地设置如下:每个超边包含K = 3 个顶点,针对每个基于单一图谱的功能连接网络(FCN),训练了一个具有256和64个神经元的两层超边感知超图卷积网络(HGCN),其中激活函数φ采用ReLU。两个图谱读出的权重系数 k1 和 k2分别被设置为0.3和0.7。我们应用了三个全连接层,每层分别有128、32和2个神经元。两个正则化参数被设置为α=1×10-3和β=5×10-3。训练的轮数(epoch)为30,批量大小为24,学习率为0.001。
3.3 比较方法
对于ASD识别,将CcSi-MHAHGEL与其他几个相关基线进行了比较,包括SVM、DNN、BrainNetCNN、GEL、BrainGNN、HGEL、GAT和MGEL和MHGEL。
3.4 分类性能
表2展示了上述九种竞争方法和CcSi-MHAHGEL在自闭症谱系障碍(ASD)识别任务中的分类结果。CcSi-MHAHGEL在所有五个评估指标上均取得了最佳的整体结果。具体而言,与其它九种竞争方法的最佳结果相比,CcSi-MHAHGEL的准确率提高了6.25%,敏感性提高了6.33%,精确度提高了9.63%,F1分数提高了7.62%,AUC提高了8.77%。这些改进通过配对t检验具有统计学意义,例如,准确率的p值为0.0086,AUC的p值为0.0044。
此外,多视图方法(即MGEL、MHGEL和CcSi-MHAHGEL)在大多数评估指标上表现优于所有单视图方法(即SVM、DNN、BrainNetCNN、GEL、BrainGNN、GAT和HGEL)。这表明,与仅使用基于单个图谱的FCN相比,有效地利用基于多图谱的FCN的互补信息对分类性能的提升是有益的。另一方面,基于超图的深度学习方法(即HGEL、MHGEL和CcSi-MHAHGEL)优于其基于简单图的对应方法(即GEL和MGEL)。具体而言,CcSi-MHAHGEL在所有评估指标上平均至少比MGEL提高了6%的分类结果;此外,MHGEL也优于MGEL。这表明,在脑网络分析中,超图比简单图更能有效地表征脑区(ROIs)之间的高阶关系,从而使超图卷积网络(HGCN)在ASD识别中提取更具区分性的FCN嵌入方面更具优势。
表2.不同方法比较ASD/HC分类性能
3.5 消融研究
消融实验,分别验证了CcSi-MHAHGEL中超边感知的超图卷积网络(HGCN)以及类别一致性模块和站点独立性模块的有效性。具体来说,Cc-MHAHGEL和Si-MHAHGEL是CcSi-MHAHGEL的两个变体,分别移除了站点独立性模块和类别一致性模块)。而HAHGEL和MHAHGEL则是将HGEL和MHGEL中的传统HGCN替换为超边感知HGCN后的结果。从图3可以看出,MHAHGEL在所有五个评估指标上均优于MHGEL,例如准确率提高了3.76%,AUC提高了6.58%。此外,HAHGEL在每个图谱上的表现也优于HGEL,所有评估指标平均至少提高了3%。这表明,我们的超边感知HGCN比传统HGCN更强大。Cc-MHAHGEL和Si-MHAHGEL的整体性能虽然不如CcSi-MHAHGEL,但优于MHAHGEL。例如,与CcSi-MHAHGEL相比,Cc-MHAHGEL的准确率下降了0.55%,Si-MHAHGEL下降了1.06%;而与MHAHGEL相比,Cc-MHAHGEL的准确率提高了1.93%,Si-MHAHGEL提高了1.42%。这表明,类别一致性模块和站点独立性模块通过考虑嵌入空间中类内和类间受试者关联以及站点间数据的异质性,有助于提升分类性能。
图3 CcSi-MHAHGEL中的超临界HGCN以及类一致性和站点独立性模块的消融性能
3.6 共享关联矩阵的构建
图4展示了不同的共享关联矩阵构造策略对超图基础的深度学习方法(即HGEL、MHGEL和CcSi-MHAHGEL)分类结果(即准确率)的影响。从图4可以看出,我们在本文中采用的连接策略在所有三种方法中是最优的,与其他两种替代构造策略相比。
图4.三种基于超图的深度学习方法的准确性(即,HGEL、MHGEL和CcSi-MHAHGEL)对共享发生率矩阵具有不同的构建策略
3.7 CcSi-MHAHGEL发现的最具区分性的兴趣区
为了发现与自闭症谱系障碍(ASD)最相关的具有区分性的感兴趣区域(ROIs),通过应用梯度加权类激活映射(Grad-CAM),量化了每个ROI对CcSi-MHAHAHGEL分类性能的相对贡献。具体来说,Grad-CAM利用最后一个超图卷积层和全连接层的信息,为每个受试者的每个节点(即ROI)获取类别激活值。对于每个图谱,在图5中展示了类别特定的热图。然后计算了所有受试者(无论类别)中每个ROI的平均激活值,以反映该区域对分类任务的贡献。为了便于说明,因此使用BrainNet Viewer可视化了每个图谱中最具区分性的前10个ASD相关ROIs,并相应地在图6中计算了平均激活值。大量证据表明,作为“社交脑”网络中的关键区域之一,颞中回已被广泛报道与ASD相关。此外,在ASD患者的中额回中发现了区域同质性降低。与默认模式网络(DMN)以及视觉空间处理、共情和记忆高度相关的楔前叶在ASD儿童中连接不足。语言缺陷是自闭症的核心症状之一,颞上回参与听觉处理,包括语言处理,但也被认为是社交认知中的一个重要结构。已报道ASD的区分性功能连接(FCs)出现在舌回,并且在ASD青少年的双侧颞枕区域(包括颞中回、枕中回、枕上回、右梭状回、左楔叶等)中局部功能连接异常增加。总的来说,可以看出,CcSi-MHAHGEL检测到的最具区分性的ROIs与之前自闭症研究中报道的一致。注意,CcSi-MHAHGEL为使用的两个图谱检测到的ROIs(在图6中)有一些不重叠的区域。这是合理的,因为基于多图谱的FCN嵌入学习的优势之一是利用每个图谱的互补信息,CcSi-MHAHGEL除了可以学习图谱共享的特征外,还可以学习图谱特定的特征。
图5.通过将Grad-CAM应用于CcSi-MHAHGEL生成的特定类别热图
图6 每个图谱集的10个最具辨别力的ASD相关感兴趣区的可视化以及由Grad-CAM计算的平均激活值。其相应的全名见表3
表3 每个脑图集的兴趣区名称和缩写
4. 讨论
4.1 FSG嵌入的可视化
为了研究不同方法(即GEL、HGEL、MGEL和CcSi-MHAHGEL)获得的原始功能连接网络(FCN)特征和提取的FCN嵌入的分布,我们采用了二维t-分布随机邻域嵌入(t-SNE)方法,将它们的维度降低到二维,如图7所示,其中原始FCN特征是指FCN矩阵向量化后的下三角部分。从图7可以看出,子图(a)和(b)中的健康对照(HC)和自闭症谱系障碍(ASD)受试者混乱地混合在一起,没有明显的分界线,而在其他子图(c)到(h)中,受试者在每个类别内表现出紧凑性(即聚集在一起),而在两个类别之间表现出差异性(即相互分离)。特别是,CcSi-MHAHGEL在子图(h)中展示了更好的可视化结果。这反映了区分ASD患者和HC受试者的难度,而我们的CcSi-MHAHGEL可以最好地促进ASD的识别。另一方面,可以在子图(a)和(b)中看到特定站点的聚类(例如,橙色的UM1和绿色的USM),而在子图(h)中,提取的基于多图谱的FCN嵌入与采集站点之间的关系明显减少。这表明ABIDE中确实存在特定站点的异质性,借助站点独立性模块(12),CcSi-MHAHGEL可以很好地对此进行校正。当将CcSi-MHAHGEL在子图(h)中的t-SNE投影结果与MGEL在子图(g)中的结果进行比较时,CcSi-MHAHGEL显示出更强大的能力来提取特定类别和站点独立的基于多图谱的FCN嵌入,这归功于超边感知HGCN捕获的高阶特征表示,同时通过实施类别一致性和站点独立性模块来整合先验知识。
图7 不同方法(即GEL、HGEL、MGEL和CcSi-MHAHGEL)得到的原始功能连接网络(FCN)特征和提取的FCN嵌入的二维t-SNE投影。圆形点表示健康对照(HC)受试者,而三角形点表示自闭症谱系障碍(ASD)受试者。不同的颜色代表不同的站点成员,即相同颜色的受试者属于同一个站点。
4.2 关键超参数的影响
研究了关键超参数对CcSi-MHAHGEL性能的影响,这些超参数包括:用于构建超边的K近邻方案中的K值,正则化参数α和β(公式13),以及在加权拼接两个读数以获得基于多图谱的FCN嵌入时的权重系数k1和k2。为了探索K值(即每个超边中的顶点数)的敏感性,检查了当K = 1, 3, 5, 7, 9, 11时CcSi-MHAHGEL的性能。当K = 1(即H = I)时,ROIs之间没有关系,这意味着每个ROI不能从其邻居那里传播信息,因此超图卷积层在节点级别上等同于一个标准的多层感知器。如图8所示,当K = 3时,CcSi-MHAHGEL实现了最佳性能。这可能是因为随着K值的增加,生成的超图变得如此密集,以至于产生了冗余和/或有噪声的脑网络描述。
图8 K近邻超图中具有不同K值的拟议CcSi-MHAHGEL的准确性和AUCUS结果。
在图9中,展示了类别一致性模块和站点独立性模块参数α和β对CcSi-MHAHGEL分类性能的影响,其中通过网格搜索在它们各自的范围内(α ∈ {10-4, 5 × 10-4, 10-3, 5 × 10-3} 和 β ∈ {10-3, 2 × 10-3, 5 × 10-3, 10-2})展示了不同α和β值下的准确率。随着α和β值的变化,性能有轻微的波动,最优的α值为10-3,β值为5 × 10-3。
图9 提出的CcSi-MHAHGEL在不同正则化参数α和β值下的准确率结果
图10展示了CcSi-MHAHGEL在不同非负值的k1和k2组合下的性能,其中k1 + k2 = 1。当k1 = 0和1时,CcSi-MHAHGEL简化为单视图方法(即,使用类别一致性和站点独立性模块的超边感知HGEL,称为CcSi-HAHGEL),分别仅使用基于HO的FCNs和基于AAL的FCNs。从图10可以看出,CcSi-HAHGEL的表现优于图3中展示的HAHGEL,例如,对于AAL图谱的准确率提高了0.50%,对于HO图谱的准确率提高了0.73%,这进一步验证了两个强制模块的有效性。我们还测试了k1的所有其他值,范围从0.1到0.9,步长为0.1。从图10中可以看出,性能先增加后开始下降,k1和k2的最优值分别为k1 = 0.3和k2 = 0.7。这表明基于HO的FCNs对于ASD识别可能比基于AAL的FCNs具有更高的区分能力。这与表2中的结果一致,即(除了BrainNetCNN之外)使用基于HO的FCNs的方法总是比使用基于AAL的FCNs的方法取得更好的结果。
图10 CcSi-MHAHGEL在不同的读出权重系数k1和k2设置下的准确率和AUC(曲线下面积)结果
4.3 类一致性和站点独立性模块的概括能力
进行额外的实验来评估类别一致性和站点独立性模块的泛化能力。具体来说,将这两个模块分别应用到GEL、HGEL、GAT、MGEL和MHGEL上。相应地得到了CcSi-GEL、CcSi-HGEL、CcSi-GAT、CcSi-MGEL和CcSi-MHGEL。然后获取了它们在ASD/HC分类任务上的性能,如表4所示。通过比较表2中GEL、HGEL、GAT、MGEL和MHGEL的结果与表4中CcSi-GEL、CcSi-HGEL、CcSi-GAT、CcSi-MGEL和CcSi-MHGEL的结果,可以看出加入这两个模块可以进一步提高分类性能。这表明这两个模块,即类别一致性和站点独立性模块,能够与不同的方法很好地泛化。
表4 CcSi-GEL、CcSi-HGEL、CcSi-GAT、CcSi-MGEL和CcSi-MHGEL的ASD/HC分类性能(平均值(标准)%)
4.4 CcSi-MHAHGEL具有三个基于图谱的FSG的结果
在上述所有结果中,CcSi-MHAHGEL仅专注于基于两种图谱的FCN嵌入学习(即AAL和HO)。在这里,通过添加第三个图谱,即Dosenbach160(DOH),来探索CcSi-MHAHGEL在基于三种图谱的FCN嵌入学习中的有效性。使用不同组合的三种图谱的FCN进行ASD识别的CcSi-MHAHGEL结果总结在表5中。CcSi-MHAHGEL在使用所有三种图谱的FCN时实现了最佳性能,与使用两种图谱的FCN相比,准确率至少提高了4.84%。这表明,构建在更多图谱上的FCN的效用将有助于提高CcSi-MHAHGEL在ASD/HC分类性能上的表现。
表5 使用基于三种图谱的FCN进行ASD/HC分类的性能(平均值(标准差)%)
4.5 CcSi-MHAHGEL总体结果
在上述实验中,考虑了来自四个主要站点的受试者。为了验证CcSi-MHAHGEL的有效性,在整个ABIDE数据库上进行了额外的实验。具体来说,选择了总共19个站点(每个站点包含超过10名受试者)。结果,共有805名受试者,其中372名ASD患者和433名健康对照(HC)案例。如表6所示的比较结果表明,与四种相关方法(即GEL、GAT、HAHGEL和MGEL)相比,CcSi-MHAHGEL具有强大的诊断能力。
表6 CcSi-MHAHGEL在整个ABIDE数据库(包括19个站点)上的ASD/HC分类性能(平均值(标准差)%)
4.6 超边构建方案的影响
在CcSi-MHAHGEL中,从HC和ASD两个类别出发,通过基于ROI顶点特征之间的欧几里得距离的K最近邻步骤构建超边(即H)。在此,研究了另一种常见的超边构建方案。具体而言,在该方案中,对于每个ROI vj,超边ej由第j行中平均功能连接网络矩阵(来自一个类别中所有训练受试者)的前 K%最大绝对功能连接(FC)值连接的ROIs(包括 vj 本身)组成,超图结构也是通过连接两个类别特定的超图结构生成的。在实验中,我们在CcSi-MHAHGEL中测试了 k = 1%、5%、10% 和 20%) 的情况,并获得了最佳准确率 79.54%(标准差 3.10%)和AUC 87.72%(标准差 3.01%),这些结果略优于表2中使用超边构建方案的CcSi-MHAHGEL的结果。可以看出,不同的超边构建方案会影响CcSi-MHAHGEL的性能,因此,选择或设计最适合的超边构建方案以进一步改进CcSi-MHAHGEL将是未来研究的一个有趣方向。
4.7 局限性和未来的工作
此文章开发了一个CcSi-MHAHGEL框架,用于在多中心、多图谱fMRI场景中识别自闭症。在CcSi-MHAHGEL中,引入了类别一致性模块,以考虑类内和类间受试者之间的关联。然而,每个受试者与其他受试者的关联仅基于其基于多图谱的功能连接网络(FCN)嵌入之间的距离,而未纳入其他因素(例如性别、年龄和一些临床变量),这些因素可能会进一步影响关联的强度。在站点独立性模块中,使用了希尔施克(HSIC)来衡量所学习的基于多图谱的FCN嵌入与采集站点之间的统计依赖性。作为HSIC的替代方法,还有许多其他多变量统计方法(例如,多变量互信息和距离相关性)。可以通过使用上述方法来加强类别一致性和站点独立性,从而在未来的工作中改进当前的CcSi-MHAHGEL。此外,FCN是静态的,忽略了时间动态性。因此,将动态FCN建模为空间-时间图,从而在CcSi-MHAHGEL框架内实现空间-时间图卷积网络(GCN)或超图卷积网络(HGCN)将是一个有趣的方向。通过这种方式,可以同时纳入每个感兴趣区(ROI)的脑活动动态性和ROI之间的功能交互。 最近,基于Transformer的方法取得了成功。受学习脑网络结构中高效注意力权重的启发,基于Transformer的CcSi-MHAHGEL值得进一步研究。
5. 总结
这篇文章引入了一个CcSi-MHAHGEL框架,用于提取基于多图谱的功能连接网络(FCN)嵌入,并将其应用于多中心自闭症谱系障碍(ASD)识别。该框架开发了超边感知的超图卷积网络(HGCN),而不是传统的图卷积网络(GCN)或超图卷积网络(HGCN),以捕捉大脑网络中的复杂信息。此外,在嵌入空间中强制实施了类别一致性和站点独立性模块,分别用于考虑类内和类间受试者的关联以及不同站点之间的异质性。具体而言,类别一致性模块增强了嵌入的类内紧凑性和类间可分性。与此同时,站点独立性模块促进了站点无关嵌入的学习。最后,在ABIDE数据库上的实验结果表明,在ASD/HC分类方面优于几种可比的方法。
精读分享
1 研究背景
近年来,基于功能磁共振成像(fMRI)的功能连接网络(FCN)分析在脑疾病自动诊断中展现出巨大潜力。FCN通过分析大脑不同区域之间的功能连接(FC)来揭示潜在的神经影像学生物标志物,用于诊断自闭症、精神分裂症和抑郁症等疾病。然而,现有的基于图卷积网络(GCN)的FCN分析方法大多忽略了多图谱信息和多中心数据中的站点影响,且未能充分利用超图结构来捕捉大脑网络中的高阶关系。这篇文章提出了一种新的框架CcSi-MHAHGEL用于多中心、多图谱fMRI数据的FCN分析,以解决上述问题。
2. 研究方法
2.1 数据来源与参与者
这篇文章使用了ABIDE数据库中的数据,包括来自四个最大样本量站点(纽约大学、密歇根大学、犹他大学医学院和耶鲁大学)的355名受试者(167名自闭症谱系障碍患者和188名健康对照者)。所有受试者的静息态fMRI数据均经过标准化预处理,并基于AAL和HO图谱分别划分为116和111个感兴趣区(ROI),计算每对ROI之间的功能连接矩阵(FCN矩阵)。
2.2 神经影像分析流程
超图构建:对于每个受试者,基于每个图谱的功能连接矩阵构建超图。超图中的超边能够连接多个ROI,从而捕捉大脑网络中的高阶关系。
多视图超边感知超图卷积网络(HGCN):提出了一种多视图超边感知HGCN,用于提取基于多图谱的FCN嵌入。与传统HGCN不同,这篇文章中HGCN能够自适应学习超边权重,而不是使用预定义的固定权重。
类别一致性模块:通过最小化类内差异和最大化类间差异,增强嵌入的类内紧凑性和类间可分性。
站点独立性模块:通过最小化嵌入与采集站点之间的统计依赖性,减轻因扫描平台和/或协议差异导致的站点影响。
2.3 统计方法与模型
这篇文章采用10折交叉验证进行实验,评估指标包括准确率、敏感性、精确度、F1分数和AUC。模型的超参数通过实验优化,例如超边包含3个顶点,HGCN网络结构为2层,神经元数量分别为256和64。
3. 研究结果
在ABIDE数据库的多中心、多图谱fMRI数据上,CcSi-MHAHGEL框架在自闭症(ASD)与健康对照(HC)分类任务中取得了显著优于其他方法的结果。结果表明,CcSi-MHAHGEL框架在ASD识别任务中具有显著的性能优势,能够更准确地区分ASD患者和健康对照者。CcSi-MHAHGEL通过整合基于多个图谱(如AAL和HO)的FCN信息,充分利用了多视图数据的互补性。实验结果表明,多图谱方法(如CcSi-MHAHGEL和MGEL)的性能优于单图谱方法(如SVM、DNN、GEL等),表明多视图信息对于分类性能的提升具有重要作用。与基于简单图的GCN方法相比,基于超图的HGCN能够更有效地捕捉大脑网络中的高阶关系。CcSi-MHAHGEL在性能上显著优于基于简单图的方法(如GEL和MGEL),证明了超图结构在FCN分析中的优越性。通过增强类内紧凑性和类间可分性,显著提升了嵌入的判别能力。实验中,加入类别一致性模块的CcSi-MHAHGEL在分类性能上优于未加入该模块的变体(如MHAHGEL)。通过最小化嵌入与采集站点之间的统计依赖性,有效减轻了站点异质性对分类结果的影响。实验结果表明,CcSi-MHAHGEL在不同站点的数据上表现出良好的一致性和稳定性。
4. 讨论与结论
通过2D t-SNE降维技术,展示了不同方法提取的功能连接网络(FCN)嵌入的分布情况。结果显示,CcSi-MHAHGEL能够将健康对照(HC)和自闭症(ASD)受试者更清晰地区分开来,表现出更好的类内紧凑性和类间可分性。此外,CcSi-MHAHGEL在提取的嵌入中显著减少了站点信息的影响,表明站点独立性模块的有效性。
将类别一致性和站点独立性模块应用于其他方法(如GEL、HGEL、GAT、MGEL和MHGEL),结果表明这些模块能够显著提升这些方法的分类性能。类别一致性和站点独立性模块具有良好的泛化能力,可以与不同的网络架构结合使用。
在CcSi-MHAHGEL中使用三个图谱(AAL、HO和DOH)的性能,发现相比于仅使用两个图谱,加入第三个图谱可以进一步提升模型性能。这表明多图谱FCN嵌入学习能够充分利用不同图谱的互补信息,从而提高ASD识别的准确性。
5. 批判性思考与展望
文章的框架引入了 类别一致性模块,以考虑类内和类间受试者之间的关联。然而,当前方法仅基于多图谱功能连接网络(FCN)嵌入之间的距离来衡量受试者之间的关联,未纳入性别、年龄和临床变量等因素,这些因素可能进一步影响关联强度。在站点独立性模块中,使用了希尔施克(HSIC)来衡量学习到的 FCN 嵌入与采集站点之间的统计依赖性。未来工作可以考虑使用其他多变量统计方法(如多变量互信息和距离相关性)来优化类别一致性和站点独立性。此外,考虑的 FCN 是静态的,忽略了时间动态性。未来可以将动态 FCN 建模为空间-时间图或超图,从而在 CcSi-MHAHGEL 框架内实现空间-时间图卷积网络(GCN/HGCN),以同时纳入每个感兴趣区(ROI)的脑活动动态性和 ROI 之间的功能交互。鉴于基于 Transformer 的方法在其他领域取得了成功,未来还可以探索基于 Transformer 的 CcSi-MHAHGEL,以高效学习脑网络结构中的注意力权重,进一步提升模型性能。
参考文献:
Wang, W., Xiao, L., Qu, G., Calhoun, V. D., Wang, Y.-P., & Sun, X. (2024). Multiview hyperedge-aware hypergraph embedding learning for multisite, multiatlas fMRI based functional connectivity network analysis. Medical Image Analysis, 94, 103144.