目录
1 研究背景
2 研究方法
2.1 纵向数据集
2.2 图像预处理
2.3 个体化区域放射组学相似网络构建
2.4 分离度(模块化)度量
2.5 分离度指数发育变化的建模
2.6 分离指数与认知表现的相关性分析
2.7 成像转录组分析
3 研究结果
3.1 三个尺度上的纵向年龄相关变化的分离指数
3.2 R2SN的分离指数反映个体认知表现
3.3 局部分离指数的年龄效应与基因表达谱的关联研究
4 讨论
4.1 R2SN分离性在儿童后期至青少年早期呈现增强趋势
4.2 R2SN与脑功能的关系
4.3 R2SN发育与基因表达的关系
4.4 R2SN的放射组学/纹理特征
4.5 局限性、方法学考量与未来方向
5 结论
1 研究背景
人类大脑发育具有持续至成年期的漫长发展轨迹。青春期大脑经历显著的结构重组与功能重塑,这一关键阶段既是认知与情绪发展的黄金期,同时也增加了神经发育障碍的易感性。因此,深入理解该阶段人脑的典型发育轨迹,对于揭示发育性精神行为障碍的结构基础、功能特征及深层机制具有至关重要的意义。近年来,研究者日益运用图论将大脑建模为互连区域的网络。其中,皮层形态相似性网络(MSN)通过计算多模态MRI特征向量的区域间相关性,验证了"结构模型"的假说:即具有相似微观结构的脑区倾向于相互连接。在此基础上提出的区域放射组学相似网络(R2SN)方法,突破性地采用纹理特征构建相似性网络。这些纹理特征通过量化结构MRI信号强度的空间分布模式,能捕捉人眼不可见的微观结构信息。R2SN对MRI信号强度微观结构改变的敏感性,使其成为研究脑发育的理想工具。人脑网络遵循"整合-分离"的双重组织原则。研究表明,从儿童期到青少年期,脑网络拓扑组织会向更分布式模式转变。通过量化R2SN的分离特征,研究人员能够评估形态学分离程度。研究者提出假说:R2SN的分离性改变可能与执行功能发展相关。
针对上述问题,本研究通过多层面方法系统揭示了区域放射组学相似网络(R2SN)的年龄相关纵向变化:(1)利用纵向T1加权磁共振成像(T1w-MRI)数据集构建个体化R2SN;(2)在全局、系统和局部三个水平量化分离指数;(3)采用混合效应模型刻画网络指标的发育轨迹,以表征纵向变化特征;(4)探究分离指数与工作记忆和视觉注意功能表现的关联;(5)整合空间基因表达数据与局部分离指数的发育变化进行影像转录组学分析。本研究成果将深化对典型发育变化的理解,并为认知发展的神经结构基础提供新的理论见解。
2 研究方法
2.1 纵向数据集
本研究数据来源于"中国儿童学校功能与脑发育项目"(CBD北京队列),共纳入309名6.2-13岁典型发育儿童的494次磁共振扫描(女142名,男167名)。部分受试者接受了重复扫描(44名完成3次扫描,97名完成2次),每次间隔约1年。采用三维各向同性1 mm³ T1加权MPRAGE序列获取高分辨率解剖图像。所有参与者均通过全国标准化认知能力测试确认认知功能正常,且无相关疾病史及MRI禁忌证。本研究经北京师范大学伦理委员会批准(批号:IRB_A_0004_2019001),所有参与者或其监护人签署了知情同意书。
图1 纵向影像样本的年龄-性别分布示意图。(A)所获取的494次扫描均以实心圆点表示;309名受试者按行排列,其多次扫描数据通过直线连接(B)样本构成:168名受试者完成1次扫描,97名完成2次扫描,44名完成3次扫描
认知功能评估采用:
(1)数字N-back任务(403次扫描)测量工作记忆(2-back辨别力指数)
(2)儿童版注意网络任务(ANT,411次扫描)测量视觉注意(三种注意条件的平均反应时)
2.2 图像预处理
每名受试者的解剖磁共振图像均经过人类连接组计划(HCP)最小预处理流程处理,并针对儿童大脑特点进行了若干调整。预处理步骤包括前连合-后连合(AC-PC)对准、脑组织提取、读出畸变校正,以及采用基于边界的配准代价函数进行T1加权(T1w)和T2加权(T2w)图像的刚体变换配准。在去除非脑组织后,使用T1w和T2w图像乘积的平方根进行偏置场校正。最后,将CBD解剖图像非线性配准至中国儿科脑图谱(CHNPD,6-12岁)。
2.3 个体化区域放射组学相似网络构建
基于Brainnetome脑图谱(210个皮层和36个皮层下亚区),从每个脑区提取47个特征,包括:一阶特征(14个):基于直方图的描述符,提供每个感兴趣区(ROI)的全局信息(如均值、最大值、最小值、方差和峰度);二阶/高阶纹理特征(33个):描述ROI内灰度强度的相互关系,通过计算确定强度为i的像素与强度为j的像素在特定空间关系中出现频率的矩阵获得。
图2 R2SN构建流程
基于特征相关性分析,移除了22个冗余特征(相关系数r>0.9),最终保留25个最具代表性的特征。由此得到的纹理特征矩阵规模为25 × 246,随后用于对每位受试者进行进一步分析。最终,通过生成一个大小为246 × 246的连接矩阵,为每个T1w数据集计算了单独的R2SN,其中节点对应于根据脑网络组图谱(Brainnetome atlas)定义的大脑区域。边则是利用各脑区之间影像组学特征的皮尔逊(Pearson)相关性计算得出的。由此得到的r矩阵是一个完全连通的有权图。
2.4 分离度(模块化)度量
(1) 网络矩阵特征:246×246相关矩阵(R值);对角线置零处理;节点分类:210皮质节点(Yeo 7大功能网络)、36皮质下节点。
(2) 连接性计算:
系统内连接性:同一网络节点间平均R值;
系统间连接性:跨网络节点间平均R值。
(3)分离度指标:
系统分离度指数:系统内与系统间纹理特征相似性的相对差异,因此该分离度指数反映了解剖学和形态学上的分离(即模块间与模块内的形态差异);
局部分离度:反映了某一节点与其所在系统内其他节点的纹理相似性,相较于该节点与不同系统中节点的纹理相似性;
全局分离度:8个网络平均分离度
2.5 分离度指数发育变化的建模
(1)模型选择依据:处理纵向数据(受试者流失、不规则间隔测量);同时考虑固定效应和随机效应;纳入年龄的线性和非线性影响。
(2)模型构建:使用MATLAB R2019b"lme"函数,将常数、线性和二次模型拟合到数据中;固定效应:性别、年龄(线性/二次项);随机效应:受试者特异性截距和斜率。
示例模型公式:分离度指数 ~ 1 + 性别 + 年龄 + (1|受试者)
表1
(3)模型评估:针对每个分离度指数,研究人员采用最大似然(ML)估计法和基于贝叶斯信息准则(BIC)的模型选择方法,对所有八种混合效应模型(四种固定效应与两种随机效应的组合)进行了检验。为了在系统和局部分离度指数的统计分析中考虑多重比较,研究者应用了Benjamini-Hochberg错误发现率(FDR)校正,并使用pFDR < 0.05的显著性阈值来识别显著模型。对于通过BIC选择且通过FDR校正的二次模型,研究人员采用1000次迭代的自助法重采样来计算年龄平方项系数值的自助比率(BSR),并使用|z分数| > 2的阈值来评估其显著性。
2.6 分离指数与认知表现的相关性分析
采用myPLS工具箱进行偏最小二乘相关(PLSC)分析,通过奇异值分解(SVD)获取潜在成分(LCs)。分析前通过回归消除年龄和性别影响。在行为领域分析中,他们采用了前述四项认知测量指标,包括2-back辨别力指数(D-prime)以及警觉、定向和执行控制注意的平均反应时间。
分析层面:系统水平——对包含8个网络分离指数和4项认知指标的交叉协方差矩阵应用奇异值分解(SVD);区域水平——对包含246个局部分离指数和相同4项认知指标的交叉协方差矩阵应用SVD。
统计验证:(1)置换检验——对脑测量指标进行1000次置换操作(随机重排受试者顺序同时保持行为测量指标不变),由此计算得到1000个无效脑-行为协方差矩阵,并获取无效假设下奇异值的抽样分布。通过比较每个LC观测到的奇异值与其对应的无效分布,计算得到各LC的统计学显著性。(2)Bootstrap分析——为准确解释第一个潜在成分(LC1),研究人员首先通过将原始数据投影至这些权重,计算得到LC1的脑指标(分离指数)和认知综合得分。随后,通过计算原始分离指数、认知表现指标与其综合得分之间的相关系数,获得脑指标和认知指标的载荷值。特定测量指标的正/负载荷值越大,表明该指标对LC1的贡献越重要。研究者采用1000次迭代的Bootstrap重采样方法,计算了脑指标和认知指标载荷的95%置信区间,并使用|z分数|>2的Bootstrap比率阈值来筛选具有统计学意义的脑指标和认知测量指标。
2.7 成像转录组分析
为了研究R2SN发育变化与基因表达谱之间的关联,研究人员使用了从Allen人类大脑图谱提供的六例尸检大脑(1例女性和5例男性,年龄24.0–57.0岁)中获得的微阵列表达数据。微阵列数据通过abagen工具箱(版本0.1.3)进行处理,并在蒙特利尔神经研究所(MNI)坐标空间中与左半球的123个脑区进行空间匹配,经过探针重新注释、数据过滤和标准化后,生成了一个123×15633的区域基因表达矩阵。
为了探索与R2SNs衍生的局部分离指数的年龄相关效应相关的潜在基因表达谱,研究人员进行了皮尔逊相关性分析以识别相关基因。通过使用与脑图(从123个左脑区的局部分离指数混合效应模型结果中获得的年龄项的t图)的空间自相关(SA)相匹配的替代脑图(n = 1000)来测试相关性的显著性(pcorr-SA)。pcorr-SA的显著性阈值为0.05,并通过假发现率(FDR)进行校正。然后,研究人员根据绝对相关系数对所有存活的正相关和负相关基因分别进行排序,并对这两组基因分别进行基因富集分析。
为了理解排名靠前的相关基因的重要性,研究人员使用了Metascape工具进行了富集分析。对于每一份给定的基因列表,研究者使用了以下本体资源进行了通路和过程富集分析:基因本体(Gene Ontology, GO)——包括GO生物过程、GO细胞组分和GO分子功能——以及京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes, KEGG)通路。研究人员首先识别了所有统计学上富集的GO/KEGG术语,累积超几何分布p值和富集因子被计算并用于过滤。得到的富集通路以0.05作为显著性阈值,并通过假发现率(FDR)进行校正。剩余的显著性术语随后根据它们的基因成员之间的Kappa统计相似性被分层聚类成一棵树。0.3的Kappa分数被用作将树划分为术语簇的阈值。每个簇中最具显著性的术语被用来在条形图和热图等可视化输出中代表该簇。通过创建富集网络,进一步增强了这些簇的可视化,利用Cytoscape以力导向布局揭示了这些术语之间的关系和功能关联。
3 研究结果
3.1 三个尺度上的纵向年龄相关变化的分离指数
全局水平:
在儿童后期和青少年早期,平均系统分离显著线性增加(年龄项的pFDR = 0.03)。且平均系统内相关性始终强于平均系统间相关性。
系统水平:腹侧注意网络的分离指数呈纵向下降趋势(年龄项的pFDR = 0.002),而边缘系统(年龄项的pFDR = 0.007)和背侧注意网络(年龄项的pFDR = 0.024)则表现出增加趋势。
局部水平:49个节点中有31个节点呈增加趋势,而腹侧注意网络和前顶叶网络的某些区域则表现出减少趋势。
图3 R2SNs的分离指数及其发展变化
3.2 R2SN的分离指数反映个体认知表现
系统水平PLSC结果:LC1解释了59.9%的协方差,在经过置换检验后仍然显著(p = 0.002),并且大脑与认知综合评分之间存在显著相关性(r = 0.24,p < 0.001)。系统分离指数在大脑载荷中表现出显著的正相关,其中皮下、前顶叶和默认系统具有最高的载荷值。此外,工作记忆、定向和执行控制表现出显著的认知载荷。
在局部水平上PLSC结果:LC1解释了45.7%的协方差(p = 0.004),并且大脑与认知综合评分之间表现出显著相关性(r = 0.33,p < 0.001)。此外,研究人员在表面图上可视化了局部分离指数的大脑载荷。与系统水平的结果相对应,具有最高正载荷值的区域主要位于皮下区域以及默认和背侧注意系统,而负载荷主要出现在与视觉系统相关的区域。显著的认知载荷包括定向、执行控制和2-back任务的D-prime值。
图4 偏最小二乘分析揭示了系统和局部分离指数与个体认知表现之间的多变量关联
3.3 局部分离指数的年龄效应与基因表达谱的关联研究
基因筛选结果:为探究局部分离指数的年龄效应与基因表达谱之间的潜在关联,本研究采用Pearson相关分析对全部15,633个基因进行排序,并进行了1000次空间自保留置换检验。通过pcorr-SA值及FDR校正,最终筛选出475个与局部分离指数年龄效应呈正相关的基因,以及441个呈负相关的基因。相关性最强的基因为NUMA1(正相关,r=0.419,pcorr-SA<0.001)和KCNMB2(负相关,r=-0.424,pcorr-SA=0.001)。
正相关基因富集:主要识别出与基因表达调控、染色质和染色体组织、细胞周期与分裂、核酸代谢与修复以及转录翻译调控相关的条目,例如"染色质组织"和"DNA代谢过程"。这表明在局部分离指数随年龄增长而增加的脑区中,这些基因的表达水平也相应升高。同时,这些基因在维持基因组稳定性、调控基因表达以及促进细胞增殖等基本细胞功能中发挥着关键作用。
负相关基因富集:与之相反,与局部分离指数年龄效应呈负相关的基因主要富集于突触功能、线粒体功能、神经元发育与连接、脂质代谢以及细胞内蛋白质转运与定位等相关条目中。具体富集条目包括"突触前膜"、"轴突"和"神经元突起发育"。这些基因的表达水平随局部分离指数随年龄增长而升高呈现下降趋势,它们在神经传递、细胞能量代谢、神经元结构发育与维持等基本细胞过程中起着不可或缺的作用。
图5 局部分离指数年龄效应与基因表达水平的关联分析
4 讨论
4.1 R2SN分离性在儿童后期至青少年早期呈现增强趋势
在系统水平上,研究人员发现腹侧注意网络的分离指数呈现纵向下降,而背侧注意网络和边缘网络则随年龄增长而增强。这一发现与功能连接研究结果以及脑结构网络模块化分离特征相一致。研究人员观察到视觉系统内11个脑区的局部分离指数随年龄显著增加。这一发现提示,这些区域分离指数的升高可能源于系统内连接的增强、系统间连接的减弱,或两者兼而有之。该结果与既往关于模块化密度发育变化的研究一致,后者发现视觉系统内部连接随年龄下降,而视觉系统与其他系统间的连接并未增加。视觉系统内部连接的减弱支持了研究者发现的分离指数年龄相关性增长。同时本研究发现局部分离指数的发育变化主要发生在联合皮层和皮层下区域,这与既往证实儿童与成人结构枢纽相似性的研究结果一致,即枢纽区主要定位于联合皮层和皮层下区域。基于MSN的研究表明,异质皮层和旁边缘/皮下区域之间的更高不相似性与更好的认知表现相关,反映了分离的细胞构筑区域的发育分化。相反,皮层和皮下之间模块化分化程度较低的儿童表现出更多的外化和内化症状。研究人员推测,R2SN的分离可能也是由分离的细胞构筑区域的发育分化引起的。
4.2 R2SN与脑功能的关系
既往研究表明,大脑功能与结构的分离程度与认知表现相关,工作记忆能力随年龄增长而提升,这与额顶皮层的结构成熟有关。研究发现默认系统和皮层下系统的分离指数与认知表现呈正相关,支持联合系统分离性与执行功能增强的关联。从宏观角度看,区域分离可能反映脑区内神经调谐的增强,而整合则源于区域间网络的特化。既往网络分析研究表明,大脑结构连接的组织模式支持信息的高效处理,从而维持复杂脑功能。本研究发现,儿童期向青春期的过渡阶段以R2SN全局分离性增强为特征,从功能视角看,这表明网络信息传递的特化程度提升。虽然R2SN主要反映脑区形态学相似性,但由于结构基础天然支持功能连接,它也隐含功能层面的意义。研究人员对两种网络进行了直接比较,发现大多数脑区连接边存在约0.2的正相关性,表明形态相似性与功能连接存在适度但稳定的关联。
4.3 R2SN发育与基因表达的关系
理解这些基因的功能富集有助于阐释儿童至青少年期局部分离指数变化的潜在分子机制。鉴于神经影像学单独描述分子机制的局限性,研究人员进行了影像转录组分析,鉴定出两个与局部分离指数年龄效应相关的基因集。结果显示,与R2SN局部分离指数年龄效应呈正/负相关的基因分别富集于不同的生物学过程,这些过程与脑结构和功能的发育变化密切相关。具体而言,与局部分离指数年龄效应正相关的基因主要富集于"染色质组织"、"染色质结合"、"细胞周期"和"细胞分裂"等条目——这些过程通过维持基因组稳定性、调控基因表达和促进细胞增殖等关键机制发挥作用,其表达水平随局部分离指数年龄增长而升高。大脑发育过程中R2SN局部分离指数的年龄相关性增加可能源于这些支持基因表达精确调控和细胞协同变化的生物学过程。因此,本研究的结果支持染色质动态变化和基因调控与神经元连接模式存在复杂关联,并最终影响局部分离性和脑功能成熟的假说。研究人员推测局部分离指数的增加可能源于不同脑区基因调控下的神经元数量与密度变化,从而导致脑区间相似性降低。
与局部分离指数年龄效应呈负相关的基因富集于“突触前膜”、“轴突”、“神经元突起发育”、“突触组织”和“线粒体膜”等术语,这些功能与神经元通讯和连接密切相关。青春期阶段,神经网络重塑与突触修剪对大脑发育至关重要。这些基因的表达水平随着局部分离指数随年龄增长而升高呈现下降趋势,它们参与神经传递、细胞能量代谢以及神经元结构发育与维持等基础生理过程。R2SN分离度的降低可能反映了神经网络精细化及不同脑模块间连接的增强,表明发育过程中脑网络整合很可能是通过突触强化和神经元投射增强实现的,从而促进不同脑区之间更高效的通讯协调。影像转录组学分析结果表明:R2SN分离度在脑发育过程中的变化受到特定分子机制调控——分离度增强与确保基因精准调控和细胞增殖的生物学过程相关,而分离度减弱则与神经元连接精细化和突触组织优化相关联。
4.4 R2SN的放射组学/纹理特征
放射组学/纹理特征描述了信号强度的模式或空间分布,被认为能够捕捉肿瘤病灶微环境与均质性的信息(如微血管侵犯或癌性血管栓),并与肿瘤影像学研究中的免疫浸润、基因表达谱、病理结果及生存数据相关联。本研究中,R2SN的边缘反映了脑区间25个纹理特征的相似性。最终用于构建网络的25个特征并非基于传统形态学信息,而是通过每个感兴趣区域内灰度级分布计算得出。因此该方法具有较高敏感性,更可能捕捉并定量描述宏观结构变化显现前由微结构发育引起的MRI信号强度细微改变,从而为超越皮层体积与厚度的脑发育研究提供更微观的视角。在分子机制层面,分离现象与节点间高度互联的群组或子网络存在相关,这被认为部分源于抑制性中间神经元的成熟过程——同步化抑制可能对建立分离网络功能至关重要。本研究中观察到的纹理特征相似性,可能反映了神经元数量、类型与架构的跨区域相似性,以及周围胶质细胞、脉管系统、细胞外间隙和自由水的分布特性。根据连接结构模型理论,脑区在皮层类型上越接近,参与连接的层级越多,其结构与功能连接的强度也越强。因此,纹理特征相似性与细胞类型或微环境邻近性可能存在某种程度的相关性。需要承认的是,放射组学特征仅依靠数据驱动方法来表征脑影像的空间纹理,这使得其生物学意义尚不明确。但已有研究证明,放射组学指标能够表征脑肿瘤的分子、免疫组化与病理特征以及神经退行性疾病的特性。
4.5 局限性、方法学考量与未来方向
尽管本研究取得了显著发现,仍需认识到若干局限性。首先,本研究所用纵向数据集中,在3个时间点接受MR扫描的受试者样本量较小。但通过采用混合效应模型处理重复测量数据,研究者有效解决了数据缺失问题。此外,由于数据集两端年龄段的受试者数量较少,数据分布存在一定不平衡性。其次,所有分析均采用 chronological age(时序年龄)而非青春期分期(如Tanner分期),考虑到青春期成熟涉及复杂的生物与生理变化,目前尚不确定何种特征最能代表这一过程。未来若结合青春期分期相关指标来研究这一过渡期的年龄相关网络发育变化,将提供更具价值的生物学信息。第三,基于R2SN的脑发育初步探索虽然有效,但受限于放射组学数据驱动的本质,该方法难以深入揭示所观察关系的生物学基础。未来研究可通过结合正电子发射断层扫描(PET)成像和组织学数据等其他影像模态,有望更精准描述脑发育的微观变化,为脑发育评估及神经发育障碍应用奠定坚实基础。关于R2SN构建所用特征数量,验证实验表明即使减少构建特征数量,该网络仍保持稳健性能。在特定特征选择范围内,网络完整性得以保持,印证了其稳定性。但需进一步研究以全面理解引入额外形态学参数对网络构建过程的潜在影响。最后,鉴于AHBA数据集是目前最全面且具有高空间分辨率的基因表达资源,研究人员将其作为基因表达分析的主要数据源。该数据集为潜在基因表达模式提供了宝贵见解,但需谨慎解读分析结果——因该数据源自成人死后脑组织,可能无法反映不同年龄阶段的基因表达水平差异。未来研究需要纳入与儿童各发育阶段匹配、且空间分辨率与AHBA相当的基因表达数据,以验证并强化当前研究结果。
5 结论
综合研究结果表明,R2SN在发育过程中分离度的增强与个体执行功能表现相关,且与参与发育过程的基因表达水平存在关联。本文首次将R2SN应用于发育中大脑的研究,为皮层和皮层下区域的典型结构变化提供了新见解。这些发现填补了关于功能发育背后特定结构改变的关键空白(超越单纯连接性研究),支持了儿童后期至青少年早期认知能力显著发展的深层机制。
原文献:
Chu L, Zeng D, He Y, Dong X, Li Q, Liao X, Zhao T, Chen X, Lei T, Men W, Wang Y, Wang D, Hu M, Pan Z, Tan S, Gao JH, Qin S, Tao S, Dong Q, He Y, Li S. Segregation of the regional radiomics similarity network exhibited an increase from late childhood to early adolescence: A developmental investigation. Neuroimage. 2024 Nov 15;302:120893. doi: 10.1016/j.neuroimage.2024.120893.