大脑网路分析的进展:基于大规模自监督学习的诊断| 文献速递-先进深度学习疾病诊断

Title

题目

BrainMass: Advancing Brain Network Analysis for Diagnosis with Large-scale Self-Supervised Learning

大脑网路分析的进展:基于大规模自监督学习的诊断

01

文献速递介绍

功能性磁共振成像(fMRI)利用血氧水平依赖(BOLD)效应已成为神经科学中的重要工具。它为体内映射认知神经底物提供了独特的机会。最近,fMRI广泛用于分析脑功能障碍,并能够揭示相互作用的脑区域网络。许多脑疾病似乎源于局限于特定脑功能而非结构性局部病变的破坏 。这一范式的关键结果是功能性脑网络的发展,通过不同感兴趣区域(ROI)BOLD信号之间的相关性来估计神经相互作用和时间同步。这些网络已成为研究脑疾病的不可或缺工具,检查各种疾病中潜在的连接组。

近年来,脑功能网络分析领域深受深度学习方法影响,这些方法通过非线性和深度嵌入表示来表征ROI的复杂相互作用,并显著改善疾病诊断性能。这些方法包括卷积神经网络(CNN)、图神经网络(GNN)和Transformer网络。尽管取得了显著进展,但这些研究的普遍局限性是它们的普适性和适应性有限 [18], 。仍然主要使用特定任务的模型,受注释样本数量有限并且难以适应其他任务。此外,缺乏少样本或零样本学习的能力,限制了它们在仅有少量带注释MRI可用的临床场景中的潜在应用。此外,数据异质性也限制了其普适性。

通过大规模自监督学习(SSL)是解决这一问题的方法之一,可以生成均匀和通用的表示。这种方法显示出潜力,在其他领域的各种下游任务中获得了显著的性能增益 。与传统预训练模型不同,基于大规模数据集预训练的基础模型可以使用单一的模型权重处理各种任务 。然而,在医学图像分析领域,特别是在脑网络中开发基础模型存在显著挑战,主要是由于数据样本有限和自监督学习不足。目前利用SSL进行脑网络的研究仅达到了与非SSL方法相当的性能。因此,目前迫切需要针对脑网络的特定基础模型。

为此,我们旨在填补脑网络基础模型的空白。在本文中,我们收集了来自多个中心的大样本队列,包括46,686名参与者的70,781个样本。我们还介绍了一种增强方法,通过随机删除BOLD信号中的时间点来创建更多脑网络,形成伪功能连接(pFC)。此外,我们提出了BrainMass,首个专为脑网络分析设计的基础模型,通过面具建模和自监督学习中的表示对齐预训练Transformer编码器:

(1)MRM:MRM通过随机屏蔽一些ROI并通过其余ROI预测被屏蔽特征来执行。特别是,分类头用于预测元标签(被屏蔽ROI的索引),重构头用于估计被屏蔽ROI的特征。这种方法有助于关联内部网络依赖关系,并增强下游任务的局部特性。

(2)LRA:BrainMass利用LRA采用双分支方法从同一BOLD信号中提取两个pFC的表示,并使它们规范化为相似的潜在嵌入。该设计承认来自同一参与者的增强脑网络应产生相似的潜在表示。我们利用双分支网络从两个pFC中提取嵌入,并使它们的规范化更接近。

Abstract

摘要

Foundation models pretrained on large-scaledatasets via self-supervised learning demonstrate exceptional versatility across various tasks. Due to the heterogeneity and hard-to-collect medical data, this approach isespecially beneficial for medical image analysis and neuroscience research, as it streamlines broad downstreamtasks without the need for numerous costly annotations.However, there has been limited investigation into brainnetwork foundation models, limiting their adaptability andgeneralizability for broad neuroscience studies. In thisstudy, we aim to bridge this gap. In particular, (1) we curated a comprehensive dataset by collating images from 30datasets, which comprises 70,781 samples of 46,686 participants. Moreover, we introduce pseudo-functional connectivity (pFC) to further generates millions of augmentedbrain networks by randomly dropping certain timepoints ofthe BOLD signal. (2) We propose the BrainMass frameworkfor brain network self-supervised learning via mask modeling and feature alignment. BrainMass employs Mask-ROIModeling (MRM) to bolster intra-network dependencies andregional specificity. Furthermore, Latent RepresentationAlignment (LRA) module is utilized to regularize augmentedbrain networks of the same participant with similar topological properties to yield similar latent representations byaligning their latent embeddings. Extensive experimentson eight internal tasks and seven external brain disorderdiagnosis tasks show BrainMass’s superior performance,highlighting its significant generalizability and adaptability.Nonetheless, BrainMass demonstrates powerful few/zeroshot learning abilities and exhibits meaningful interpretation to various diseases, showcasing its potential use forclinical applications.

基于大规模自监督学习预训练的基础模型展示了在各种任务中异常的多功能性。由于医学数据的异质性和难以收集的特点,这种方法对医学图像分析和神经科学研究尤为有益,能够在无需大量昂贵注释的情况下简化广泛的下游任务。

然而,对于大脑网络基础模型的研究还存在有限的探索,限制了它们在广泛神经科学研究中的适应性和普适性。在本研究中,我们旨在填补这一空白。具体而言,(1)我们通过整合来自30个数据集的图像筛选出了一个全面的数据集,包括46,686名参与者的70,781个样本。此外,我们引入了伪功能连接(pFC),通过随机删除BOLD信号的特定时间点生成数百万个增强的脑网络。(2)我们提出了BrainMass框架,用于通过面具建模和特征对齐进行脑网络自监督学习。BrainMass采用Mask-ROI建模(MRM)来加强网络内部依赖关系和区域特异性。此外,利用潜在表示对齐(LRA)模块来规范同一参与者的增强脑网络,使它们具有类似的拓扑特性,通过调整它们的潜在嵌入来产生类似的潜在表示。

对八项内部任务和七项外部脑部疾病诊断任务进行的广泛实验显示,BrainMass表现出卓越的性能,突显其显著的普适性和适应性。尽管如此,BrainMass展示了强大的少/零样本学习能力,并展示了对各种疾病的有意义解释,展示了其在临床应用中的潜力。

Method

方法

The brain functional networks X are derived by mappingprocessed neuroimages onto a template with V Regions of Interest (ROIs). These networks are symmetric positive definitematrices, X ∈ R V ×**V . For diagnosis purposes, the goal is todevelop a mapping function f : X → y, where y representsthe predicted diagnosis phenotype for each subject.In this study, we first generate two pFCs for each participant,and feed them into the BrainMass framework for pre-traininga brain network Transformer (BrainTF) encoder. During thedownstream classification phase, we froze the BrainTF anduse it to extract latent representations, Z, for each participant. The learned latent representations are further fed intoa Support Vector Machine (SVM) classifier for downstreamprediction. This process is shown in Fig. 1. To note that, in thetraining phase, the BrainMass consists of three components:the MRM network, the online network, and the target network.Each network features a BrainTF encoder, sharing the samearchitectural design. The BrainTFs in the MRM and onlinenetworks share the same weights, while the BrainTF in thetarget network is updated by an exponential moving averagebased on the online network.

脑功能网络 X 通过将处理后的神经影像映射到一个包含 V 个感兴趣区域(ROIs)的模板上得到。这些网络是对称正定矩阵,X ∈ R V ×**V。为了进行诊断,目标是开发一个映射函数 f : X → y,其中 y 代表每个受试者的预测诊断表型。在本研究中,我们首先为每位参与者生成两个 pFC,并将其输入到 BrainMass 框架中,用于预训练脑网络变压器(BrainTF)编码器。在下游分类阶段,我们冻结 BrainTF,并使用它为每个参与者提取潜在表示 Z。学习到的潜在表示进一步输入支持向量机(SVM)分类器进行下游预测。此过程如图1所示。需要注意的是,在训练阶段,BrainMass 包含三个组件:MRM 网络、在线网络和目标网络。每个网络都具有一个 BrainTF 编码器,具有相同的架构设计。MRM 和在线网络中的 BrainTF 共享相同的权重,而目标网络中的 BrainTF 则通过基于在线网络的指数移动平均值进行更新。

Conclusion

结论

In this study, we propose BrainMass, the first foundationmodel specifically designed for brain network analysis anddisease diagnosis through functional measurements. BrainMass leverages the MRM and LRA modules to pre-trainthe Transformer encoder, focusing on intra-network dependencies and bootstrapped regularized latent representations.Our BrainMass model fosters generalizable and homogeneousrepresentations, facilitating a wide range of brain disorderdiagnoses using a single model set. Moreover, visualizations ofthe attention maps and multivariate analysis of the latent reprsentations demonstrate the model’s potential emergent abilityto discriminate between abnormal and normal states. Thishighlights its potential for clinical application with robust zeroshot and few-shot learning capabilities. Our study providesnew insights into the application of large-scale self-supervisedlearning in the realm of brain functional network analysis andaddresses the lack of large models in brain network analysis.

在本研究中,我们提出了BrainMass,这是第一个专为脑网络分析和疾病诊断而设计的基础模型,通过功能性测量来实现。BrainMass利用MRM和LRA模块对Transformer编码器进行预训练,重点放在网络内部依赖关系和引导正则化的潜在表示上。

我们的BrainMass模型促进了可泛化和均匀的表示,利用单一模型集进行广泛的脑部疾病诊断。此外,注意力热图的可视化和潜在表示的多变量分析展示了模型在区分异常和正常状态方面潜在的能力。这突显了其在具有强大的零样本和少样本学习能力的临床应用潜力。

我们的研究为大规模自监督学习在脑功能网络分析领域的应用提供了新的见解,并解决了脑网络分析中大模型的缺乏问题。

Results

结果

For comparison, two categories of baseline models areincluded: those with SSL and those without SSL. The baselinemodels without SSL include BrainNetCNN , DHGNN, BrainGNN , Semi-GCN , vanillaTransformer(vanillaTF), and BrainNetTransformer (BrainNetTF) . ForSSL comparisons, powerful SSL frameworks like BYOLand MOCO are included. Furthermore, we considered twoexisting works: BrainNPT  and BrainGSLs.

为了比较,我们包括了两类基准模型:一类是使用了SSL的模型,另一类是没有使用SSL的模型。没有使用SSL的基准模型包括BrainNetCNN 、DHGNN 、BrainGNN 、Semi-GCN 、vanilla-Transformer(vanillaTF)和BrainNetTransformer(BrainNetTF)。对于SSL比较,我们还包括了强大的SSL框架,如BYOL 和MOCO 。此外,我们考虑了两个现有的工作:BrainNPT 和BrainGSLs 。

Figure

图片

Fig. 1: Illustration of (i) the construction of pFC, (ii) the training phase of BrainMass method, including an MRM (an MRMnetwork) and an LRA (an online network and a target network) module, and (iii) the inference phase of BrainMass.

Fig. 1: 图示包括以下内容:(i) pFC的构建过程,(ii) BrainMass方法的训练阶段,包括MRM(一个MRM网络)和LRA(一个在线网络和一个目标网络)模块,以及(iii) BrainMass的推断阶段。

Fig. 2: The effect on the dropping rate on eight internal tasks.

图2:降低率对八个内部任务的影响。

图片

Fig. 3: The effect on the model size

Fig. 3: 模型大小的影响

图片

Fig. 4: The accuracy performances on seven external tasks.

Fig. 4: 七个外部任务的准确率表现

Fig. 5: The workflow of the zero/few-shot learning for Brain Mass.

Fig. 5: BrainMass的零/少样本学习工作流程

图片

Fig. 6: Heatmaps of the Transformer encoder attention maps on 7 tasks, including the averaged attention maps (the first row),those of the first layer (the second row), and the last layer (the third row). The values in heatmaps are normalized into 0 to 1.

Fig.

 6: Transformer编码器在7个任务上的注意力热图,包括平均注意力热图(第一行)、第一层的注意力热图(第二行)和最后一层的注意力热图(第三行)。热图中的值已归一化到0到1之间。

图片

Fig. 7: Visualization on the ten key regions. The key regions are colored with the corresponding sub-network. Temp: thetemporal. Par: the parietal. Cing: the cingulate. Med: the medial. PFC: the prefrontal cortex. pCun: the precuneus. PCC: theposterior cingulate cortex. OFC: the orbital frontal cortex.

Fig. 7: 十个关键区域的可视化。关键区域用相应的子网络着色。Temp: 颞叶区。Par: 顶叶区。Cing: 扣带回。Med: 中央区。PFC: 前额皮层。pCun: 楔前叶。PCC: 后扣带皮层。OFC: 眶额皮层。

Table

TABLE I: Demographical information on 30 datasets.

TABLE I: 30个数据集的人口统计信息

图片

TABLE II: Classification results of different approaches on 8 tasks of 6 internal datasets in terms of accuracy (Acc), sensitivity(Sen), and specificity (Spe). SSL indicates the model is pretrained by self-supervised learning.

TABLE II: 不同方法在6个内部数据集的8个任务中,根据准确率(Acc)、灵敏度(Sen)和特异度(Spe)的分类结果。SSL表示模型通过自监督学习进行预训练。

图片

TABLE III: Ablation studies on the elements of BrainMass with the accuracy (%) performance on eight internal tasks.

TABLE III: BrainMass各元素的消融研究,以八个内部任务的准确率(%)性能为基准。

图片

TABLE IV: p-values after correction of the 10 key brain regions.  indicates the key regions with significant difference.

TABLE IV: 经过校正后的10个关键脑区的p值。表示具有显著差异的关键区域。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/34776.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

威士顿携手 TDengine,共同推动工业数据处理效率提升

在全面推动数字化转型的背景下,实体经济与数字化经济的深度融合正成为行业新旧动能转换、建设现代工业经济运行体系、实现高质量发展的战略支点。其中,时序大数据的有效处理成为转型的关键驱动力,为实现智能化决策、精准运营和未来发展提供有…

代码随想录算法训练营:15/60

非科班学习算法day15 | LeetCode110:平衡二叉树 ,Leetcode257:二叉树的所有路径 ,Leetcode404:左叶子之和,Leetcode222:完全二叉树的节点个数 目录 介绍 一、基础概念补充: 1.平衡二叉树 二、LeetCode题目 1.LeetCode110:平…

面试-java多线程与并发

1.如何实现处理线程的返回值 (1)主线程等待法 主线程等待法:程序执行时,没有等到value值赋予完成,就直接在主函数 中执行打印value的值。 缺点:需要自己去实现循环等待的逻辑。若需要等待的变量变多,需要等待的时间可能…

【信息系统项目管理师知识点速记】变更管理

19.2 变更管理 变更管理是指在信息系统开发与维护过程中,控制所有变更请求,从而确保变更的顺利实施和系统的稳定运行。变更管理的目标是使变更过程透明化,保证每个变更有序可控地进行,减少变更带来的负面影响,提高变更实施的效率和质量。变更管理包括变更申请、评估、批准…

qt.qpa.xcb: could not connect to display问题解决

1、问题描述 以服务器pi5作为远程解释器,本地win11使用vscode远程调试视觉时报错如下: qt.qpa.xcb: could not connect to display qt.qpa.plugin: Could not load the Qt platform plugin "xcb" in "xxxxx" even though it was …

英伟达GB200系列AI芯片供不应求;阿里云通义灵码上线Visual Studio插件市场

🦉 AI新闻 🚀 英伟达GB200系列AI芯片供不应求 摘要:英伟达GB200系列AI芯片供不应求,台积电和日月光等公司获追加订单。GB200芯片性能提升30倍,成本和能耗降至25分之一。预计2025年出货量突破百万颗,后段封…

ArkUI JS层

JS层代码分析 关键方法: initialRenderobserveComponentCreationViewStackProcessor.StartGetAccessRecordingForViewStackProcessor.StopGetAccessRecording()loadDocument class Index extends ViewPU {constructor(parent, params, __localStorage, elmtId -…

浏览器优化的案例和最佳实践

浏览器优化的案例和最佳实践 减少HTTP请求数量优化资源文件优化DOM结构提升JavaScript性能优化渲染性能移除不必要的插件和扩展监控并分析页面性能持续优化和测试除了上述的优化方式,还有一些其他的浏览器优化技巧,包括: 减少HTTP请求数量 案例:某电商网站首页有大量的图片和C…

探索Java中的多态

多态(Polymorphism)是面向对象编程(OOP)中的一个核心概念,它允许同一个接口或方法在不同对象上具有不同的实现方式。Java作为一种面向对象的编程语言,广泛地利用了多态特性来提高代码的灵活性和可扩展性。本…

精准把握时间脉络:Java日期时间处理API深度解析与实战指南

在软件开发领域,准确无误地处理日期和时间信息是构建稳定、可靠应用程序的关键一环。随着技术的演进,Java作为一门广泛应用的编程语言,其处理日期和时间的API也经历了显著的变化和发展,旨在为开发者提供更为强大、灵活且易用的工具…

httpclient并发性能问题解决

故事 前段时间进行招聘笔试,有这么一个问题,请描述实践过程中解决httpclient并发性能问题的案例。然后自己之前是有遇到过,但是一直没有总结,趁此机会总结一波。 问题 请描述实践过程中解决httpclient并发性能问题的案例。并描…

企业级低代码开发效率变革赋能业务增长

企业级低代码开发已经成为当今软件开发领域的一大趋势,它为企业带来了前所未有的效率变革,从而赋能业务增长。本文将围绕这一主题,深入探讨低代码开发的概念、优势以及如何在企业级应用中实现高效的低代码开发,以助力我国企业实现…

Linux网络 - 再谈、详谈UDP和TCP协议

文章目录 前言预备netstatpidofcat /etc/services 一、UDP协议UDP协议端格式UDP的缓冲区基于UDP的应用层协议 二、TCP协议1.TCP协议段格式确认应答(ACK)机制三次握手疑问1 最后一次客户端发给服务端的ACK请求怎么保证服务端能够收到? 四次挥手疑问2 为什么挥手是四次…

51单片机STC89C52RC——4.1 矩阵按键(数码管显示按键值)

目录 目录 目的 一,STC单片机模块 二,矩阵按键模块 2.1 针脚定义 ​编辑 2.2 矩阵按键位置 2.3 如何理解按键按下后针脚的高低电平 2.3.1 错误理解1 2.3.2 错误理解2 2.3.3 正确判定按下的是那个按键的逻辑 2.3.4 判定按键按下的依次扫描程…

2024年618有哪些必囤的好物?2024年618好物排行榜

618年中大促再度来临。对于购物爱好者来说,这无疑是一个不容错过的购物盛宴。那么,在这个618,哪些好物值得你重点关注呢?我特地整理了一份推荐清单,这些产品不仅经过我的亲身体验,更以其出色的实用性和高性…

MySQL中结构化系统变量介绍

结构化变量(structured variable)与常规系统变量(regular system variable)之间的两个主要区别。以下是这两个区别的详细解释: 值是一个结构: 常规系统变量通常存储单一的值,比如一个整数、浮…

【XCharts插件】4-2、配置项手册(v3.0)

推荐阅读 CSDN主页GitHub开源地址Unity3D插件分享简书地址QQ群:398291828大家好,我是佛系工程师☆恬静的小魔龙☆,不定时更新Unity开发技巧,觉得有用记得一键三连哦。 一、前言 XCharts插件是一款基于UGUI的功能强大、易用、参数可配置的数据可视化图表插件。 【Unity3D…

硬件基础知识——自学习梳理

计算机存储分为闪存和永久性存储。 硬盘(永久存储)主要分为机械磁盘和固态硬盘。 机械磁盘主要靠磁颗粒的正负极方向来存储0或1,且机械磁盘没有使用寿命。 固态硬盘就有使用寿命了,大概支持30w次的读写操作。 闪存使用的是电容…

使用js实现excel的读取展示以及导出

代码 <!DOCTYPE html> <html lang"zh"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>Document</title><link rel"st…

liunx打开谷歌报错

liunx打开谷歌报错[48526:48526:0624/173553.311113:ERROR:zygote_host_impl_linux.cc(99)] Running as root without --no-sandbox is not supported. See https://crbug.com/638180. 这个错误信息表明你尝试以root用户身份运行Chrome浏览器&#xff0c;但是没有使用–no-san…