Hum Brain Mapp:用于功能连接体指纹识别和认知状态解码的高精度机器学习技术

摘要

人脑是一个复杂的网络,由功能和解剖上相互连接的脑区组成。越来越多的研究表明,对脑网络的实证估计可能有助于发现疾病和认知状态的生物标志物。然而,实现这一目标的先决条件是脑网络还必须是个体的可靠标记。在这里,本研究利用人类连接组项目数据,考察了被试的大脑指纹和认知状态。本研究的方法在识别fMRI扫描被试和对先前未见过的被试的认知状态进行分类方面实现了高达99%的准确率。更广泛地说,本研究使用大量被试(865名)在不同认知状态(8种)下的fMRI功能连接数据,探索了五种不同机器学习技术在个体指纹识别和认知状态解码目标上的准确性和可靠性。此外,本研究还比较了16种不同的功能连接体(FC)矩阵构建流程,以表征FC生成的不同方面对个体和任务分类准确性的影响,并确定可能存在的混淆因素。

前言

功能连接是一种衡量不同脑区活动之间的统计依赖性指标。实际上,它作为一种相关性度量,通常在所谓的“静息状态”下进行估计,也就是说,在没有明确任务指令的情况下进行估计。所有神经元素之间的全功能连接集定义了一个功能性脑网络,可以将其建模为节点(脑区)和边(功能连接权重)。大量研究表明,连接权重的变化可用于准确地预测个体的认知、临床和发育状态。

近年来,人们对基于网络的“指纹识别”产生了浓厚的兴趣。也就是说,使用统计分析来发现功能性大脑网络的特征,这些特征能够可靠地区分个体。先前的研究表明,功能连接体(FC)可以在fMRI扫描中提供一致的个体指纹,并以可识别的方式编码一般认知状态的各个方面。然而,目前仍存在一些关键的方法学问题。例如,大多数研究没有直接评估不同指纹识别算法的相对性能,也没有详尽地探讨FC矩阵构建流程对指纹识别的影响。

因此,本研究利用人类连接组项目(HCP)数据集的FCs,探索了五种不同机器学习技术在个体指纹识别和认知状态解码目标上的准确性和可靠性。此外,为了表征FC生成的不同方面对个体和任务分类准确性的影响,并识别可能存在的混淆因素,本研究还比较了16种不同的功能连接体(FC)矩阵构建流程。

实验结果表明,一些机器学习技术在对HCP数据集中的FCs进行个体指纹识别和任务解码方面具有近乎完美的能力,为FCs揭示了个体及其认知状态的重要特征这一观点提供了支持,并为未来的技术测量提供了基准。这些高精度分类器的另一个好处是能够识别FC的特征,以及大脑哪些区域之间的哪些连接是进一步研究认知状态的感兴趣区域。

方法

数据描述和分类目标

数据集:原始数据集由HCP发布的865名受试者的fMRI扫描数据组成。每名受试者在7项活动任务(情绪、赌博、语言、运动、关系、社会、工作记忆)中的每项都扫描2次,静息态任务(休息)扫描4次,共扫描18次。为了消除因休息扫描次数过多而造成的数据不平衡的影响,实验期间每位受试者仅使用2次休息扫描,共计每位受试者有16次扫描。数据集中不包含任何个人身份信息。此外,通过流程从个体fMRI扫描数据中生成功能连接矩阵,该流程包括脑区分割、混淆回归以及从fMRI时间序列框架中计算相关系数矩阵。

HCP功能预处理:HCP数据集中的图像进行了最小程度的预处理。简而言之,对每个图像的梯度失真和运动进行了校正,并通过样条插值步骤与相应的T1加权(T1w)图像对齐。进一步校正强度偏差,归一化为均值10000,投射到32k_fs_LR网格,排除异常值,并使用多模态表面配准对齐到公共空间。

分割预处理:设计一个由大脑皮层上200个区域组成的分区,以优化fMRI信号的局部梯度和全局相似性指标(Schaefer200)。将分割节点映射到Yeo典型功能网络。对于HCP数据集,Schaefer200是32k_fs_LR空间中的CIFTI文件。这些工具利用在recon-all管道中计算的表面配准,根据个体表面曲率和沟纹模式将组平均图谱转换到被试空间。这种方法为每个被试呈现了一个T1w空间体积。将分割重新采样到2mm T1w空间,以便与功能数据一起使用。相同的过程也可用于其他分辨率(例如Schaefer100)。

功能网络预处理:使用Nilearn的signal.clean对所有BOLD图像进行线性去趋势、带通滤波(0.008~0.08Hz)、混淆回归和标准化处理,去除与时间过滤器正交的混淆。所采用的混淆回归已被证明是减少运动相关伪影的一个相对有效的选择。经过预处理和扰动回归,得到各节点BOLD时间序列的残差均值。

分类目标:在每个实验中,训练一个机器学习分类器以完成以下两个目标之一:受试者识别(指纹识别)或任务识别(解码)。

(1)指纹识别。为了实现这一目标,分类器同时对所有受试者的扫描进行训练,每个受试者完成七项任务,共14次扫描。对于每个受试者,从八项任务(包含静息态任务)中随机选择一项,并保留该任务的两次扫描作为验证数据集。受试者指纹分类器的准确性是使用训练好的分类器正确预测受试者的验证扫描的百分比。

(2)任务解码。对于任务解码目标,分类器在来自受试者子集的扫描上进行训练,涉及八个任务,每个受试者总共扫描16次。验证数据集由所有任务中其余子集的扫描组成。任务解码分类器的准确性是使用训练好的分类器正确预测其任务的验证扫描的百分比。

分类器架构

针对两个目标测试了五种分类器架构:

1、根据Howland和Park(2004)提出的基于广义奇异值分解的LDA分类器,它避免了对维数远低于样本数量的需求。对于每个类别,LDA分类器的结果为输入向量提供了一组线性系数,可用于得出有关输入分量对于特定类别的相对重要性的结论(并生成可视化)。

2、多层感知器神经网络(NN)分类器,其训练可以建模高阶函数。

3、支持向量机(SVM)分类器,一种使用高维数据进行分类的常见机器学习方法。近年来,许多关于人脑功能连接组学的研究都将SVM作为预测工具。

4、最近质心(NC)分类器,其结果可用于对类之间的高维空间关系进行简单推断。

5、基于相关性(CORR)的分类器,这是在FCs上进行受试者指纹识别的经典方法,已知可以在类似的数据集上获得较高的准确率。

FC矩阵构建流程

在这里,本研究考虑了经过测试的四个矩阵构建流程变量,以确定结果对数据准备差异的稳健性,其中包括:

①有无全局信号回归:通过线性回归去除fMRI时间序列的平均信号强度。

②有无任务回归:去除任务诱发激活的一阶效应。

③Schaefer-Yeo 100与200分区:大脑图谱中产生FCs的区域数量。

④截断剩余扫描时间序列帧,以与较短的任务扫描长度保持一致。

整个流程如图1所示。

图片

图1.功能连接体准备步骤的流程图。

结果

分类器精度

LDA分类器

LDA分类器在两个目标和大多数矩阵构建流程中都获得了较高的准确率(见表1)。总体而言,它似乎比NN分类器对矩阵构建流程变化的影响更敏感。

表1.所有分类器架构和所有流程的验证精度得分。

图片

从LDA分类器获得的系数(图3)通过对分类的输入特征重要性进行相对加权,为类区分的方法提供了一些验证。将输入特征映射到已知的大脑系统标签,可用于验证分类器是否“注意”与特定类别任务关联的脑区特征。

前馈神经网络(NN)分类器

表1还显示,在任务解码目标上,NN分类器比LDA分类器实现了更高和更一致的精度。然而,NN分类器在受试者指纹识别目标上的表现明显更差,这可以通过更好地选择NN超参数(更大或更多的隐藏层,不同的学习率,不同的激活函数等)、通过选择另一种NN架构或使用更大的数据集进行训练来改善。

例如,Wang等人(2019)使用DNN架构在七个任务中的类似任务解码目标上能够达到94%的准确率。他们的DNN是基于原始fMRI数据作为输入的卷积。本研究的简单三层神经网络能够在FCs输入维数显著降低的情况下获得更好的精度,这表明这种深度神经网络对于稳健的结果可能不是必要的。此外,虽然Wang等人的结果发现使用DNN的某些任务比其他任务更容易解码,但本研究的NN分类器在不同任务之间的分类精度基本上没有差异。

支持向量机(SVM)分类器

与LDA分类器和NN分类器相比,SVM分类器在任务解码目标上实现了所有架构中最高且最一致的精度分数(见图2),其结果比LDA分类器和NN分类器对矩阵构建流程的变化更稳健。

图片

图2.受试者指纹分类器和任务解码分类器的验证精度分数比较。

在受试者指纹识别目标上,SVM分类器的精度明显低于LDA和NN分类器,并且对矩阵构建流程表现出显著的敏感性。

NC分类器

NC分类器在目标和所有矩阵构建流程上的性能都相对较差;然而,它仍然达到了足够高的精度水平,可以得出一些关于数据集性质的结论。在任务解码方面,一些矩阵构建流程的精度高达90%。鉴于NC分类器中两个连接组之间的相似性度量为L2范数,具有相对较高精度的结果表明该数据集在高维空间中表现出类的聚类特性。相对于其他分类器,NC分类器在个体指纹识别上的结果同样不理想;然而,能够在大约一半的时间内正确识别出865名受试者(仅使用L2范数),再次表明与个体受试者相关的扫描具有相对较强的空间聚类。

相关分类器

Finn等人(2015)通过计算目标扫描和测试矩阵数据库之间的Pearson相关系数,获得了较高的个体识别准确性。它们使用Shen 268个节点的功能分区,对来自HCP数据集中的126名受试者进行了测试,受试者识别目标限定在单一任务扫描的测试数据库。只有当目标矩阵和测试矩阵数据库均来自休息任务时(即rest→rest),才能达到最高准确率(93%),而其他任务组合的准确率较低(例如rest→other)。此外,他们指出识别准确性对分割的选择很敏感。例如,当使用68个节点的FreeSurfer-Yeo图谱时,他们在rest→rest受试者识别上达到了89%的准确率。为了重现他们的结果,使用来自本研究数据集的126名随机受试者,使用200个节点的Schaefer-Yeo图谱,在基于相关性的识别rest→rest扫描方面获得的最高准确率为81%。最后,为了充分比较CORR分类器与LDA分类器的结果,将该技术推广到本研究的完整数据集和与任务无关的识别。使用779名受试者和rest→rest任务目标,准确率降至73%。使用779名受试者和any→all任务目标,最高准确率降至20%(图1)。

LDA特征对认知状态解码的重要性

下列可视化图像(见图3)显示了个体连接组特征与特定认知状态之间的相关性,作为从LDA分类器获得的系数的函数。

图片

图3.可视化热图。

训练/验证分割对LDA分类器的影响

LDA分类器的精度对于训练集中合理减少的扫描次数似乎具有稳健性(见图4)。然而,任务解码分类器在仅对五名受试者(共80次扫描)进行训练后保持近80%的精度,而指纹分类器要达到约80%的类似精度需要至少两个任务的训练集(3460次扫描)。

图片

图4.训练/验证分割对LDA分类器精度的影响。

模块化和中心性

最近,人们对FC研究中纯图论指标的性能产生了浓厚的兴趣。作为比较,本研究考察了使用模块化和中心性指标(而不是连接组边权重)作为两项任务中性能最佳分类器架构的输入。从200个区域中,使用Louvain社区检测和不对称的负权重参数来计算社区结构。从该社区中,计算每个脑区的参与系数,并将正、负参与系数连接作为LDA或NN分类器的输入(n=400个特征)。图5显示了参与系数法和边权重法之间的比较。在个体指纹识别和任务分类目标中,使用连接体边权重作为输入比参与系数具有更好的准确率。

图片

图5.比较LDA和NN在使用脑区参与系数vs连接体边权重作为输入时的分类精度。

FC矩阵构建流程

全局信号回归(GSR)

静息态功能连接MRI研究数量快速增长,数据处理的方法也在不断增加。其中一种处理方法是GSR,虽然有时存在争议,但它也有几个既定的好处。对于所有受试者,GSR的准确率分数要么非常类似于没有GSR的流线,要么分数略高,但有一个例外:在任务解码目标的NN分类器上,GSR的分数总体上明显更高(见图6)。

图片

图6.有与没有全局信号回归。

分割大小

100个区域和200个区域的分割产生了相似的精度分数,100-区域在所有流程和架构中的精度分数略低,但有一个例外:对于任务解码目标的LDA分类器,100-区域的分割在所有流程中的精度略高(图7)。除此之外,由于200分区实际上包含了100分区作为其特征的“子集”,因此精度的略微下降并不奇怪。

图片

图7.100个区域与200个区域的分割。

时间序列截断

截断是一个重要的步骤,一般来说,较短的样本会导致连通性估计中的采样误差越大。为了确保样本数量具有可比性,本研究测试了时间序列的截断,以在所有样本中保持大致相同的帧数。总体而言,截断其余扫描时间序列以匹配任务扫描似乎会导致所有流程和分类器架构的精度略有下降(图8)。与200分区相比,100分区的不利影响要明显得多。

图片

图8.使用与不使用时间序列截断。

任务回归

在所有测试中,使用任务回归的流程比不使用任务回归的流程分类精度更差(图9)。在任务分类目标中,回归旨在消除与每项任务相关但不是真正测量脑区活动的混淆因素。这些特定于任务的混淆的存在可能使任务区分更加容易,而去除它们可能会使任务解码变得更加困难。

图片

图9.有与没有任务回归。

特征选择

本研究考察了三种特征选择方法,以识别FC的边缘:

方差阈值:无监督方法,其中整个数据集中给定特征的方差用作其判别能力的度量,最重要的特征被认为是那些具有最高方差的特征。

SPEC:无监督方法,使用图谱分析来识别对维持数据集的空间聚类属性最重要的特征。

LDA系数:有监督方法,将一个给定特征在所有类别中的系数均值作为其判别能力的度量,最重要的特征被认为是那些系数均值最大的特征。

这三种特征选择方法都对输入特征进行了简单的优先级排序,除了确定要保留多少个“最重要”特征的阈值外,没有其他参数。将每种方法应用于整个数据集,然后使用最高精度矩阵构建流程(200个区域,w/GReg,noTReg)来测试特征缩减的FCs的准确性。特征选择实验的结果表明(图10),仅使用原始19900个特征(在200分区的情况下)中的几百个特征(即连接组的边),就可以在指纹识别和解码目标中保持高精度性能。

图片

图10.使用四种特征选择方法选择的特征子集,在指纹或解码目标上训练LDA分类器的精度(200个区域,w/GReg,noTReg)。

特别是,对于任何单个特征选择方法,从SPEC中获得的特征排序似乎在指纹识别和解码目标之间提供了高精度的最佳平衡——仅用~200个特征就达到了90%的精度。

与从SPEC获得的最高排序特征相关的大脑系统(图11)似乎在某种程度上平衡了方差阈值(DorsAttnA、DorsAttnB、VisCent、VisPeri)的最高排序特征,方差阈值对解码具有最佳的整体性能,而LDA指纹识别系数(ContA、ContB、DefaultA、DefaultB)具有最佳的指纹识别整体性能。

图片

图11.使用每种特征选择方法选择的前200个最重要的连接体边,按大脑系统排序。

高维聚类

作为评估类别(单个受试者或任务)在高维空间中表现出聚类程度的另一种方法,本研究对数据集执行了PCA,将其降至50维,然后使用t-SNE进行二维可视化(图12)。

图片

图12.利用PCA和t-SNE进行降维,以实现认知状态高维聚类的可视化。

本研究还计算了所有样本对的平均类内(组内)和类间(组间)距离,扫描按受试者或任务分组,作为聚类的简单度量(表2)。结果表明,按任务或受试者分组扫描的平均类内距离小于类间距离。

表2.受试者和任务的平均类内和类间距离的度量。

图片

结论

本研究结果表明,一些机器学习技术和矩阵构建流程可以从FCs实现高精度的个体指纹识别和任务解码。在大量受试者中进行个体指纹识别时,LDA分类器提供了最高和最一致的精度分数。在任务解码中,LDA、NN和SVM分类器的性能相似,但SVM在所有流程中略有优势。与较高的分类精度分数最一致的流程是:更精细的分区(更多的脑区)、使用GSR、无任务回归以及不使用时间序列截断。在未来的应用中,当决定使用哪种矩阵构建流程时,需要注意的是,虽然更精细的分区(更多的脑区)似乎能够提高精度,但给定扫描的特征数量会随着区域数量的平方而增加。这意味着更精细的分区虽然提高了精度,但可能会使分类器的训练成本显著增加。这里实现的高精度得益于HCP数据集,该数据集具有较高的一致性标准。未来的工作应该研究这些结果是否对来自其他数据集的扫描数据具有稳健性。

参考文献:Andrew Hannum, Mario A. Lopez. et al. High-accuracy machine learning techniques for functional connectome fingerprinting and cognitive state decoding. Hum Brain Mapp.2023;1-15.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/21996.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

性能优化-react路由懒加载和组件懒加载

背景 随着项目越来越大,打包后的包体积也越来越大,严重影响了首屏加载速度,需要对路由和组件做懒加载处理 主要用到了react中的lazy和Suspense。 废话不多说,直接上干货 路由懒加载 核心代码 import React, { lazy, Suspens…

GPS/北斗RTK差分定位系统的原理以及应用领域

导语:现代定位技术在国内外的发展与应用越来越广泛,其中GPS和北斗是两大被广泛使用的全球卫星定位系统。本文将介绍GPS/北斗RTK差分定位系统的原理以及其在各个领域的应用。 一、GPS/北斗RTK差分定位系统的原理 GPS/北斗RTK差分定位系统,即全…

【TypeScript】安装的坑!

TypeScript安装 安装TypeScript安装时候可能报错这样开头的数据(无法枚举容器中的对象)——原因:没权限先解决没权限的问题如果发现无法修改-高级-修改继续安装想使用tsc-发现,tsc不能用解决方法:配置环境变量最后的最…

便捷省心的手机直播影视工具,畅享轻松电视娱乐时光

便捷省心的手机直播影视工具,畅享轻松电视娱乐时光 在快节奏的现代生活中,我们常常渴望能够以简单、省心的方式消遣自己,享受高品质的电视娱乐。幸运的是,随着技术的进步,便捷省心的手机直播影视工具应运而生。这些工…

Adaptive autosar 都有哪些模块?各有什么功能?

Adaptive autosar是一种用于高性能计算ECU的软件平台,它支持自适应应用程序的开发和运行。它由两部分组成:基础(Foundation)和服务(Service)。基础包括了操作系统接口、执行管理、网络管理、识别访问管理、加密、更新和配置管理等功能。服务包括了通信管理、RESTful、时间…

【目标检测论文解读复现NO.33】改进YOLOv5的新能源电池集流盘缺陷检测方法

前言 此前出了目标改进算法专栏,但是对于应用于什么场景,需要什么改进方法对应与自己的应用场景有效果,并且多少改进点能发什么水平的文章,为解决大家的困惑,此系列文章旨在给大家解读最新目标检测算法论文&#xff0c…

Kubernetes v1.20 二进制部署

架构 k8s集群master01:192.168.80.101 kube-apiserver kube-controller-manager kube-scheduler etcd k8s集群master02:192.168.80.102 k8s集群node01:192.168.80.103 kubelet kube-proxy docker k8s集群node02:192.168.80…

后端整理(MySql)

1 事务 1.1 事务ACID原则 原子性(Atomicity) 事务的原子性指的是事务的操作,要么全部成功,要么全部失败回滚 一致性(Consistency) 事务的一致性是指事务必须使数据库从一个一致状态转变成另一个一致性…

使用kubeadm快速部署一个k8s集群

Kubernetes概述 使用kubeadm快速部署一个k8s集群 Kubernetes高可用集群二进制部署(一)主机准备和负载均衡器安装 Kubernetes高可用集群二进制部署(二)ETCD集群部署 Kubernetes高可用集群二进制部署(三)部署…

JVM之垃圾回收器

1.如何判断对象可以回收 1.1 引用计数法 什么是引用计数器法 在对象中添加一个引用计数器,每当有一个地方引用它时,计数器值就加一;当引用失效时,计数器值就减一;任何时刻计数器为零的对象就是不可能再被使用的。 …

【C语言学习】整数范围、整数越界、无符号数

1.整数范围 对于一个字节(8位),可以表达的范围是00000000 ~ 11111111 其中00000000 ——> 0 11111111 ~ 10000000 ——> -1 ~ -128(从大到小) 00000001 ~ 01111111 ——> 1~127(从小到大&#xff…

电脑第一次使用屏幕键盘

操作流程 1.在键盘上同时按WinR打开运行; 2.输入control 3.找到设置中心 4.点击屏幕键盘 效果 具体怎么使用 我不咋清除 简单 测试了一下 可以用鼠标点击屏幕键盘的按键 用键盘 按字母键和数字键 是和屏幕键盘不同步的 其他 tab、shift、后退、enter好像同步

《Kali渗透基础》13. 无线渗透(三)

kali渗透 1:无线通信过程1.1:Open 认证1.2:PSK 认证1.3:关联请求 2:加密2.1:Open 无加密网络2.2:WEP 加密系统2.3:WPA 安全系统2.3.1:WPA12.3.2:WPA2 3&#…

Springboot 多数据源 dynamic-datasource动态添加移除数据源

0.前言 上一篇文章我们讲了如何通过多数据源组件,在Spring boot Druid 连接池项目中配置多数据源,并且通过DS注解的方式切换数据源,《Spring Boot 配置多数据源【最简单的方式】》。但是在多租户的业务场景中,我们通常需要手动的…

RunnerGo条件控制器使用方法

在做性能测试时我们需要根据业务需求、业务场景来配置测试脚本,举个例子:在登录注册场景中,可能会有账号密码全部正确、账号格式错误、密码错误等多种情况,这里的“登录/注册”事件可以视为一个场景。一个真实业务中的场景&#x…

课程作业-基于Python实现的迷宫搜索游戏附源码

简单介绍一下 该项目不过是一个平平无奇的小作业,基于python3.8开发,目前提供两种迷宫生成算法与三种迷宫求解算法,希望对大家的学习有所帮助。 项目如果有后续的跟进将会声明,目前就这样吧~ 效果图如下所示: 环境…

设备管理系统与物联网的融合:实现智能化设备监控和维护

在数字化时代,设备管理系统和物联网技术的融合为工业企业带来了巨大的变革和创新。本文将探讨设备管理系统与物联网的融合,重点介绍设备健康管理平台在实现智能化设备监控和维护方面的关键作用和优势。 一、设备管理系统与物联网的融合 随着物联网技术的…

BPMNJS插件使用及汉化(Activiti绘制流程图插件)

BPMNJS插件运行最重要的就是需要安装nodejs插件,这不一定要安装和测试好。 主要是使用npm命令 1、配置BPMNJS插件绘制activiti7工作流 1.1、安装和配置nodejs 插件 1.1.1、下载nodejs 下载地址:https://nodejs.org/en 1.1.2、安装nodejs,傻瓜式安装 安装之后在安装…

Mac提示文件:已损坏,无法打开。你应该把它移到废纸篓

文章目录 一、电脑信息二、打开任何来源设置三、更改应用程序拓展属性 一、电脑信息 我的是新版的Venture 13的系统。UI改的比较多。与之前的配置还是有很大的区别的。 打开下载的软件,显示已经损坏,打不开。抛开软件本身的问题外,一般是Ma…

vue3过滤输入框首尾空格

vue3过滤输入框首尾空格 在 directive文件夹下 新建 trim.ts 文件 // trim.ts 文件 import { App } from "vue"function getInput(el: { tagName: string; querySelector: (arg0: string) > any }) {let inputEleif (el.tagName ! INPUT) {inputEle el.queryS…