Nature Protocols:整合多组学并进行因果推理的系统框架

转载自:MetaAI

在生物学研究中,随着实验和计算技术的进步,生物系统研究产生了大量高通量数据。技术努力主要集中在提高吞吐量、降低成本和提升实验与计算效率。因此,整合不同类型组学数据,并通过关联分析识别关键因素和机制的计算方法变得尤为重要。

发表在《Nature Protocols》中的这篇文章,提出了一个可以从多组学中推断因果关系的系统框架 - Transkingdom Network Analysis (TkNA),并详细介绍了该框架的使用流程。TkNA是一种独特的因果推理分析框架,能够整合多个数据集和不同类型的组学数据,执行荟萃分析并识别关键的调控关系。它之前被用于研究抗生素耐药微生物、2型糖尿病和免疫缺陷相关肠病,以及宫颈癌、淋巴瘤和黑色素瘤中微生物组的作用。TkNA可以识别微生物和微生物基因、宿主途径、宿主基因以及控制宿主-微生物群相互作用的主要调节因素。

图1. TkNA流程图

TkNA流程包括3个主要部分,5个阶段,并在这些之前有两个预处理步骤(图1)。TkNA可以用于分析实验验证后的结果,构成一个循环的分析框架(图2)。

图2. TkNA管道以循环方式进行

a、进行实验并获得样品。b,在开始TkNA之前对样品进行测序和标准化。c、对每种数据类型进行比较。bar图分别代表测量的基因表达水平、微生物丰度和表型。星号代表治疗组之间的显着差异,因为仅保留显着变化的特征下游分析。d、在每种数据类型之间和内部执行相关性。e,删除意外的相关性。f、重建网络。g,询问网络以寻找调控节点。h,确定从网络中找到前部节点的概率,然后进行后续验证研究并重复该循环。

TkNA不仅可以识别关键调节节点,还能计算网络的拓扑属性,并通过如Cytoscape这样的外部程序可视化网络。TkNA的方法已经用于验证多项研究中的推论。它提供了一种分析不同组学数据之间交互作用的方法,可以用于分析遗传和转录数据、代谢物、蛋白质和表型之间的相互作用。与其他方法相比,TkNA侧重于通过荟萃分析识别跨多个队列的稳健模式,并且专注于建立因果关系而非仅仅发现关联。尽管TkNA提供了强大的工具,但用户仍需要具备一定的统计知识来理解软件的适用性和局限性。

TkNA的目标用户是宿主和/或微生物组领域的研究人员,这些人员可能缺乏计算和统计专业知识。该方法适用于生物和生物医学研究的多个学科,从建立新的细胞和分子治疗靶点到研究基础生物学问题。用户无需编程专业知识,但需要熟悉Unix环境中的命令行操作,以及能够理解JSON文件格式以自定义和修改程序选项。

该手册详细描述了一个复杂的分析流程和具体步骤,并给出了相应的命令行,这个流程分为3个主要部分,涵盖了5个阶段,以及在这些阶段之前的两个预处理步骤(图1)。下面只做简单描述,具体详细步骤见原文:

第一部分:重建网络

这部分涉及数据的标准化、文件格式化以及设定统计阈值(预处理步骤)。

阶段1:数据导入、计算/荟萃分析和按用户指定的条件过滤数据。这一步骤首先找出基于用户定义的统计标准的不同类别样本(如病态与健康对照组)间表达/丰富的变量(基因、微生物、代谢物等)。然后,进行每组内和组间的相关性分析。

阶段2:基于网络的拓扑特性,用户决定是否进入下一个分析阶段。这些特性包括网络密度、观察到的正/负相关偏差及意外相关比例等。

第二部分:询问/分析重建的网络

阶段3:分析重建的网络以找出在调查的生物过程中因果作用的节点或节点组。用户可以使用TkNA识别网络中的节点集群,并通过外部推荐软件进行富集分析,以识别集群中的节点所贡献的生物途径或功能。

第三部分:从用户重建的网络分析中创建发布就绪的图表

阶段4:评估特定节点显示非随机值的概率。在这里,TkNA重建了许多随机网络,与重建网络进行比较。

阶段5:创建多种高质量的图表,包括度分布的点图、节点及其计算属性的点图,以及前调节节点的丰富度或表达水平。

图3展示了TkNA的一些输出结果。

图3. TkNA生成的示例图

a,网络属性度(degree)分布图。b,左:节点属性可视化示例,其中每个点代表重建网络中的一个节点。右图:同一张图,放大了前10个微生物BiBC节点。c,b中前部BiBC节点的丰度/表达图示例。图例显示了数据集中的两个类。在本例中,将名为“高”的样本类别与名为“低”的样本类别进行比较。盒子显示每次实验每组的四分位数;须线包括除边远点之外的其余分布。d,10,000个随机网络的二维密度图。

TkNA方法依赖于在多个实验中进行荟萃分析,以识别多个队列中倍数变化(fold change)和相关性的稳健模式。默认情况下,它使用Fisher方法来组合来自多个独立测试的P值。其他通用R包(例如,meta、netmeta和mixmeta)提供了多种元分析方法,但这些方法并未考虑因果关系原理,例如相关不等式。其他R软件包(例如MixOmics、MOFA+和iClusterPlus)也使用复杂的统计方法来组合从同一患者测量的多个组学数据。然而,它们同时应用于多个队列或独特的组学数据(其中数据组成或不满足分布假设)可能具有挑战性。TkNA提供了一个框架来实现多种组学类型和群组的同时整合。请注意,“整合”一词指的是两种截然不同的分析。具体来说,在整篇文章中以以下方式使用它:荟萃分析是来自多个独立数据集的数据的集成,而网络重建涉及在多种类型的组学数据之间建立统计依赖关系的集成。

参考文献:

Newman, N.K., Macovsky, M.S., Rodrigues, R.R. et al. Transkingdom Network Analysis (TkNA): a systems framework for inferring causal factors underlying host–microbiota and other multi-omic interactions. Nat Protoc (2024). https://doi.org/10.1038/s41596-024-00960-w

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/44515.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

linux 内核 红黑树接口说明

红黑树(rbtree)在linux内核中使用非常广泛,cfs调度任务管理,vma管理等。本文不会涉及关于红黑树插入和删除时的各种case的详细描述,感兴趣的读者可以查阅其他资料。本文主要聚焦于linux内核中经典rbtree和augment-rbtree操作接口的说明。 1、基本概念 二叉树:每个…

基于主成分分析PCA的一维时间序列信号降噪方法(Python)

主成分分析PCA是面向模式分类的特征提取最典型的工具,是满足上述映射准则的一种数据压缩的方法。作为经典的特征提取方法,是在不减少原始数据所包含的内在信息前提下,将原始数据集转化为由维数较少的“有效”特征成分来表示,使其在…

GD32F303之CAN通信

1、CAN时钟 GD32F303主时钟频率最大是120Mhz,然后APB1时钟最大是60Mhz,APB2时钟最大是120Mhz,CAN挂载在APB1总线上面 所以一般CAN的时钟频率是60Mhz,这个频率和后面配置波特率有关 2、GD32F303时钟配置 首先我们知道芯片有几个时钟 HXTAL:高速外部时钟&#xff1…

用理解与包容对待阿斯伯格综合征患者

在我们的社会中,存在着这样一个特殊的群体——阿斯伯格综合征患者。他们在社交互动、沟通交流和行为模式上有着独特的表现,需要我们以正确的方式去理解和对待。 我们要认识到阿斯伯格综合征是一种神经发育障碍,而非个人的选择或过错。患者可能…

AI Earth——中国城市绿地对大气污染干沉降作用估计数据集(DDEP)应用APP

基于数学模型量化植被的干沉降过程,突破传统站点尺度研究的局限性,结合多源卫星遥感产品形成2000-2020年中国城市绿地对PM2.5和PM10的干沉降量估计栅格数据集,对城市大气污染防治、绿地区域规划和城市可持续发展有重要意义. 应用结果 代码 #导入安装包 import os import …

本地部署,强大的面部修复与增强网络CodeFormer

目录 什么是 CodeFormer? 技术原理 主要功能 应用场景 本地部署 运行结果 结语 Tip: 在图像处理和计算机视觉领域,面部修复和增强一直是一个备受关注的研究方向。近年来,深度学习技术的飞速发展为这一领域带来了诸多突破性…

c++:面向对象的继承特性

什么是继承 (1)继承是C源生支持的一种语法特性,是C面向对象的一种表现 (2)继承特性可以让派生类“瞬间”拥有基类的所有(当然还得考虑权限)属性和方法 (3)继承特性本质上是为了代码复用 (4)类在C编译器的内部可以理解为结构体,派…

BJT交流分析+共发射极(CE)放大器+单片机的中断系统(中断的产生背景+使用中断重写秒表程序+中断优先级)

2024-7-10,星期三,16:58,天气:阴,心情:晴。今天终于阴天啦,有点风凉快一点了,不然真要受不了了,然后没有什么特殊的事情发生,继续学习啦,加油加油…

yolov5中训练长条型目标召回率低问题

对于长条目标长宽比比较大的目标,如长1000pix,宽度10pix等在训练时masic数据增强图片中会出现有的图片中标签遗失问题,将原来标注好的目标,但是在增强图片中没有标签,就会导致召回率低的问题。 在训练代码中augmentations.py文件…

MATLAB——运算符

文章目录 MATLAB——运算符算数运算符矩阵的算数运算 关系运算逻辑运算符运算优先级 MATLAB——运算符 算数运算符 MATLAB中算数运算符包括加、减、乘、除、点乘、点除等。其运算规则如下表所示: 运算符运算规则ABA与B相加(A、B为数值或矩阵&#xff0…

一键安装ros及出现问题的解决方案

wget http://fishros.com/install -O fishros && . fishroscatkin_make时出现报错如下 catkin_make时出现错误提示如下: catkin_make Base path: /home/efsz/zmq_to_ros Source space: /home/efsz/zmq_to_ros/src Build space: /home/efsz/zmq_to_ros/build…

科普文:HTTPS协议

概叙 HTTPS(Secure Hypertext Transfer Protocol)即安全超文本传输协议,是一个安全通信通道。用于计算机网络的安全通信,已经在互联网得到广泛应用。 HTTPS 是基于 HTTP 的扩展,其相当于 HTTP协议SSL(安全套…

0708,LINUX目录相关操作

主要是冷气太足感冒了&#xff0c;加上少吃药抗药性差&#xff0c;全天昏迷&#xff0c;学傻了学傻了 cat t_chdir.c #include <stdio.h> #include <unistd.h> #include <error.h> #include <errno.h> #include <sys/stat.h>int main(int argc…

鲁棒控制器设计方法:systune,hinfsyn,musyn,slTuner

systune和hinfsyn更侧重于基于数学模型的控制器设计&#xff0c;而musyn则特别考虑了系统的不确定性。slTuner则提供了在Simulink环境中进行控制器设计和调整的能力。 指定结构的控制器整定&#xff1a;systune, hinfstruct广义控制对象整定&#xff1a;musyn, mixed musyn, h…

应急响应-ELK日志分析系统

&#x1f3bc;个人主页&#xff1a;金灰 &#x1f60e;作者简介:一名简单的大一学生;易编橙终身成长社群的嘉宾.✨ 专注网络空间安全服务,期待与您的交流分享~ 感谢您的点赞、关注、评论、收藏、是对我最大的认可和支持&#xff01;❤️ &#x1f34a;易编橙终身成长社群&#…

2024年PMP考试备考经验分享

PMP是项目管理领域最重要的认证之一,本身是IT行业比较流行的证书&#xff0c;近几年在临床试验领域也渐渐流行起来&#xff0c;是我周围临床项PM几乎人手一个的证书。 考试时间&#xff1a;PMP认证考试形式为180道选择题&#xff0c;考试时间为3小时50分。 考试计划&#xff…

NFS综合项目

现有主机 node01 和 node02&#xff0c;完成如下需求&#xff1a; 1、在 node01 主机上提供 DNS 和 WEB 服务 2、dns 服务提供本实验所有主机名解析 3、web服务提供 www.rhce.com 虚拟主机 4、该虚拟主机的documentroot目录在 /nfs/rhce 目录 5、该目录由 node02 主机提供的NFS…

Spring——自动装配Bean

自动装配是Spring满足bean依赖的一种方式 Spring会在上下文中自动寻找&#xff0c;并自动给bean装配属性 在Spring中有三种装配的方式&#xff1a; 1. 在xml中显示配置 2. 在java中显示配置 3. 隐式的自动装配bean【重要】 测试 记得创建Cat、Dog、People类 public clas…

NI 5G大规模MIMO测试台:将理论变为现实

目录 概览引言MIMO原型验证系统MIMO原型验证系统硬件LabVIEW通信系统设计套件&#xff08;简称LabVIEW Communications&#xff09;CPU开发代码FPGA代码开发硬件和软件紧密集成 LabVIEW Communications MIMO应用框架MIMO应用框架特性单用户MIMO和多用户MIMO基站和移动站天线数量…

常用控件(三)

输入类控件 QLineEditQTextEditQComboBoxQSpinBoxQDateTimeEditQDialQSlider QLineEdit QLineEdit用来表示单行输入框&#xff0c;可以输入一段文本&#xff0c;但是不能换行; 核心属性: 属性说明text输入框中的文本inputMask输入内容格式约束maxLength最大长度frame是否添加边…