8+双疾病+WGCNA+多机器学习筛选疾病的共同靶点并验证表达


今天给同学们分享一篇双疾病+WGCNA+多机器学习的生信文章“Shared diagnostic genes and potential mechanism between PCOS and recurrent implantation failure revealed by integrated transcriptomic analysis and machine learning”,这篇文章于2023年5月16日发表在Front lmmunol 期刊上,影响因子为8.786。

4b55022941dfa5a912cb27a0d875f8c5.jpeg


多囊卵巢综合征(PCOS)是一种复杂的内分泌代谢紊乱疾病,影响着5-10%的生育年龄妇女。PCOS患者的子宫内膜存在改变的免疫细胞,导致慢性低度炎症,这是反复植入失败(RIF)的原因之一。

4041b6ec59b99026a3686e11b47d0e1e.jpeg

图1 整个设计的流程图


1. GEO信息

根据作者的纳入标准,共选择了四个数据集进行发现性分析:GSE10946、GSE34526、GSE103465和GSE111974。其中,GSE10946和GSE34526被用作PCOS的发现队列,而GSE103465和GSE111974被视为RIF的发现队列。此外,GSE80432和GSE26787分别是PCOS和RIF的验证队列。在本研究中,作者简称这两个疾病组为PCOS和RIF。


2. 差异基因的鉴定

在进行生物信息分析之前,作者测试了收集的数据集的批次效应,并发现两种疾病的批次效应明显(图2A,E)。使用“sva”软件包,作者去除了PCOS(图2B)和RIF组(图2F)的批次效应,以获得可靠的分析结果。然后使用LIMMA软件包对两组之间的差异表达基因(DEGs)进行表征。对于PCOS,获得了201个差异基因(P<0.05,|log2 FC|>0.585),其中101个上调基因和100个下调基因。对于RIF,有253个差异基因(adj. P<0.05,|log2 FC|>1),其中167个上调基因和86个下调基因。火山图显示了PCOS(图2C)和RIF(图2G)组的所有差异基因。总体而言,通过热图(图2D,H)可视化了这两组中包含的差异基因。与PCOS和RIF相关的差异基因可能在它们的发生和发展中起到一定作用。

81632b7a05413151dc32b24ae130f039.jpeg

图2 去除批次效应并在PCOS和RIF中识别差异表达基因


3.&nbsp;通过WGCNA筛选关键模块

为了调查疾病和关键基因是否相关,作者除了分析两组之间的差异表达外,还进行了WGCNA。使用软阈值方法,本研究构建了一个共表达网络。这个参数β对于共表达网络保持无标度拓扑结构至关重要。基于基因表达数据的生物网络很可能是无标度的。因此,在PCOS组中,拟合指数大于0.85被认为是无标度拓扑结构,β被设定为9(图3A)。通过使用邻接函数,生成了邻接矩阵。如图3B所示,使用TOM差异度量构建了层次聚类。作者总共确定了20个共表达模块。P<0.05的模块被视为关键模块。如图3C所示,antiquewhite4模块具有最强的正相关性,其中包含180个基因。同样,WGCNA也应用于RIF组,β=10是软功率的最佳值(图3D)。作者总共确定了19个模块,其中深灰色、深绿色和皇家蓝显示出强烈的正相关性,而绿黄色、鲑鱼色、深青色和浅黄色模块显示出强烈的负相关性(图3E,F)。在RIF组的这7个关键模块中的基因中,作者进一步选择了334个具有|MM| > 0.8和|GS| > 0.5的基因。这些来自两组关键模块的基因可能被用作候选的细胞特异性标记物。

456c80d424504beca23e1ce873f265fc.jpeg

图3 加权基因共表达网络分析(WGCNA)在多囊卵巢综合征(PCOS)和反复植入失败(RIF)中的应用


4.&nbsp;共同基因的分析和功能富集

为了探索多囊卵巢综合征(PCOS)和反复流产(RIF)的共同发病机制,作者分别取上述差异表达基因(DEGs)和WGCNA筛选的基因的交集。图4A显示了PCOS和RIF的DEGs之间的重叠,共有11个基因(CHST11,FAM150B,GLIPR1,SLC16A6,MAMLD1,SLC46A2,ENPP3,HAPLN1,PLCXD3,FAM110C,GAS1)。WGCNA分析的基因中只有一个与之重叠(CCND2,图4B)。作者推测这12个基因可能与PCOS和RIF的发病机制有关,并且存在共同关系(图4C)。通过对这些基因进行功能注释和富集分析(图4D,E),作者试图研究PCOS和RIF之间的潜在生物学变化。毫不奇怪,共享基因的GO分析显示它们在早期胚胎器官形态发生相关通路中过度表达。值得注意的是,在所有富集的GO术语中,作者注意到有几个显著富集的生物过程通路,例如调节T细胞凋亡过程、肥大细胞激活和白细胞稳态,这表明免疫细胞的激活和凋亡可能对PCOS和RIF的共同发病机制有着重要贡献。此外,KEGG富集结果与GO分析一致。另外,作者还注意到几个与卵泡发育相关的通路富集,例如p53信号通路、FOXO信号通路、Hippo信号通路和PI3K-Akt信号通路。

dc82301d3b745cd6ff6417c63b45918b.jpeg

图4 PCOS和RIF之间的共享基因标识和功能富集


5.&nbsp;基于机器学习算法,识别潜在的诊断基因

为了进一步选择具有显著特征值以区分疾病组和对照组的最佳诊断基因靶点,作者基于上述12个共享基因应用了三种不同的算法(LASSO、SVM-RFE和随机森林)。在PCOS组中,根据LASSO系数曲线和最佳调参选择图,将λ设定为0.06851194(PCOS)(图5A)。随后,找到了8个具有非零系数的基因。然后,作者将上述12个基因输入RF分类器,并在重要性尺度上显示了前10个基因。作者选择了0.9作为重要性筛选阈值,并确定了一组包含9个基因的集合(图5B)。此外,SVM算法确定了5个具有最低5点交叉验证误差和最佳5点交叉验证准确性的基因(图5C)。通过将这三种算法重叠,作者确定了5个共享生物标志物(CHST11、GLIPR1、SLC16A6、MAMLD1、HAPLN1、GAS1)用于PCOS组(图5D,I)。

b89f24231f0013a39cfe6971b9a2eff3.jpeg

图5 使用三种机器学习算法筛选候选的PCOS和RIF诊断基因


同样地,当使用LASSO算法将λ设置为0.03001025时,作者得到了7个特征基因,用于RIF组(图5E)。图5F显示了重要性排名前10的基因,作者选择了9个基因(重要性>0.9)作为RM结果。接下来,使用SVM-REF算法确定了10个中心基因子集(图5G)。然后,通过三种算法获得的7个共同基因标志物重叠(图5H,I)。


6. 诊断中心生物标志物的诊断价值和验证

为了更准确地了解多囊卵巢综合征(PCOS)和反复植入失败(RIF)之间的关系,作者对PCOS和RIF群体的机器学习结果进行了交集分析,并得到了2个共享的诊断基因,GLIPR1和MAMLD1(图6A)。通过分析这两个基因的表达模式,评估了共享诊断基因的预测和鉴别能力。此外,还进行了受试者工作特征曲线(ROC曲线)的分析。

387e10431b8abb38636dd9c269048233.jpeg

图6 选择和验证两个共享的诊断基因


首先,作者分析了两个发现队列中PCOS和RIF的表达水平。图6B显示GLIRP1在RIF组中较低(P<0.01),在PCOS组中较高(P<0.01)。MAMLD1在PCOS组(P<0.01)和RIF组(P<0.0001)中均表达较低(图6F)。


接下来,为了测试这两个目标基因在两种疾病诊断中的特异性和敏感性,作者进行了ROC分析。在多囊卵巢综合征生物标志物方面,这两个基因的结果是有利的:GLIPR1(AUC=0.812)和MAMLD1(AUC=0.774)。RIF组也经过了相同的ROC分析。每个生物标志物的预测性能都很强:GLIPR1(AUC=0.723)和MAMLD1(AUC=0.879)(图6C,G)。


此外,作者通过进行外部验证,确认了GLIPR1和MAMLD1作为多囊卵巢综合征(PCOS)和反复流产(RIF)的核心诊断基因的可靠性。在两个验证组中,这两个关键基因的表达水平与发现组相匹配。GLIPR1在RIF组中降低(P<0.05),在PCOS组中增加(P<0.05)(图6D)。MAMLD1在PCOS组(P<0.01)和RIF组(P<0.05)中均减少(图6H)。图6E显示,GLIPR1在PCOS验证队列中具有出色的诊断准确性(AUC=1.000),在RIF验证队列中也具有良好的诊断准确性(AUC=0.920)。同样,MAMLD1也能正确诊断PCOS(AUC=1.000)和RIF(AUC=0.840)(图6I)。因此,结果证实了它们作为PCOS和RIF的关键鉴别分子的能力。


7.&nbsp;诊断基因的单基因GSEA

随后,作者分别在PCOS和RIF数据集中使用单基因GSEA分析了这两个生物标志物,并使用“GSEA”软件包可视化了前5个上调和下调的通路。图7显示,在这两个疾病组中,这两个基因都参与了代谢通路,如甘氨酸、丝氨酸、苏氨酸代谢、α-亚麻酸代谢和丙酸代谢。此外,这两个基因还富集在与炎症相关的通路中,将PCOS和RIF联系在一起。

a49508b7e6a78a04a17a34ab97dcd4b8.jpeg

图7 &nbsp;GSEA分析


8.&nbsp;共享诊断基因的免疫浸润分析

考虑到多囊卵巢综合征(PCOS)和反复植入失败(RIF)都具有高免疫反应的特点。作者使用CIBERSORT分析了不同组别中免疫细胞的丰度。在每个组别中,22种免疫细胞的比例以条形图的形式展示。总体而言,条形图清楚地显示了PCOS(图8A)和RIF(图8E)之间T细胞、巨噬细胞和NK细胞群体百分比之间的显著差异。与对照样本相比,PCOS样本中的活化树突状细胞增加了(图8B)。而在RIF样本中,休息的NK细胞、巨噬细胞M0增加,γδT细胞和活化树突状细胞减少(图8F)。

e524ea4e6a101d656cde72139005e2a6.jpeg

图8 PCOS和RIF免疫细胞组成


此外,还研究了生物标志物与免疫细胞含量之间的关系。在多囊卵巢综合征样本中,CD8 T细胞与GLIPR1呈显著正相关(图8C)。相反,巨噬细胞M0呈负相关。MAMLD1与B细胞记忆呈显著正相关,与巨噬细胞M2、树突状细胞静止和单核细胞呈负相关(图8D)。在反复流产样本中,GLIPR1与静止NK细胞呈显著负相关(图8G)。而中性粒细胞和静止NK细胞与MAMLD1呈负相关(图8H)。免疫功能似乎对多囊卵巢综合征和反复流产的发展至关重要。


9.&nbsp;在人体组织中通过RT-PCR验证GLIPRand MAMLD的有效性

对正常女性和多囊卵巢综合征(PCOS)患者的卵泡液颗粒细胞以及健康和反复流产(RIF)女性的子宫内膜组织进行了RT-PCR检测。这证实了两个诊断生物标志物GLIPR1和MAMLD1的基因表达水平。与数据分析一致,作者的结果显示,PCOS患者的颗粒细胞中GLIPR1的表达上调,而MAMLD1的表达下调(图9A),而RIF患者的子宫内膜组织中GLIPR1和MAMLD1的表达均减少(图9B)。

9f2237b53bb0f0fcd9e2d4cdc8c6ac91.jpeg

&nbsp;图9&nbsp;


总结

总之,诊断生物标志物GLIPR1和MAMLD1被确定为关键生物标志物,负责调节由TCA循环代谢物失衡引起的免疫细胞激活。作者的分析加强了PCOS患者反复流产的共病发病理论基础。



本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/126995.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Springboot使用EasyExcel导入导出Excel文件

1&#xff0c;准备Excel文件和数据库表结果 2&#xff0c;导入代码 1&#xff0c;引入依赖 <!-- https://mvnrepository.com/artifact/com.alibaba/easyexcel --><dependency><groupId>com.alibaba</groupId><artifactId>easyexcel</artifac…

STM32—PWM开发SG90舵机

目录 PWM介绍 PWM输出模式&#xff1a; ​编辑PWM占空比&#xff1a; PWM周期与频率公式&#xff1a;​编辑 SG90舵机介绍 1. 什么是舵机 2. 怎么控制舵机 SG90舵机介绍实战 1. 在 SYS 选项里&#xff0c;将 Debug 设为 Serial Wire​编辑 2. 将 RCC 里的 HSE 设置为 …

代码随想录算法训练营第四十天丨 动态规划part03

343. 整数拆分 思路 看到这道题目&#xff0c;都会想拆成两个呢&#xff0c;还是三个呢&#xff0c;还是四个.... 来看一下如何使用动规来解决。 动态规划 动规五部曲&#xff0c;分析如下&#xff1a; 确定dp数组&#xff08;dp table&#xff09;以及下标的含义 dp[i]…

JVM修炼印记之初识

文章目录 JVM认识JVM的功能常见JVMHotSpot的发展历程 JVM认识 Java虚拟机&#xff08;Java Virtual Machine&#xff0c;JVM&#xff09;是一个用于执行Java字节码的虚拟计算机。它是Java语言的核心&#xff0c;可以在不同的操作系统和硬件平台上运行Java程序。 JVM负责将Java…

【广州华锐互动】飞机诊断AR远程指导系统为工程师提供更多支持

随着科技的发展&#xff0c;飞机的维护工作也在不断进步。其中&#xff0c;AR&#xff08;增强现实&#xff09;技术的应用使得远程运维成为可能。本文将探讨AR在飞机诊断远程指导系统中的应用&#xff0c;以及它对未来航空维护模式的影响。 AR远程指导系统是一种使用增强现实技…

撕掉Hadoop标签,Cloudera未来可期吗?

Cloudera&#xff1a;大数据的弄潮儿 1、Cloudera发展史2、Cloudera问题出在哪里&#xff1f;3、参考文章 1、Cloudera发展史 说起Cloudera&#xff0c;就不得不提起Hadoop&#xff0c;Cloudera的过去就是Hadoop时代中的一个缩影。作为全球第一家也是最大一家Hadoop商业化公司&…

HarmonyOS鸿蒙原生应用开发设计- 隐私声明

HarmonyOS设计文档中&#xff0c;为大家提供了独特的隐私声明&#xff0c;开发者可以根据需要直接引用。 开发者直接使用官方提供的隐私声明内容&#xff0c;既可以符合HarmonyOS原生应用的开发上架运营规范&#xff0c;又可以防止使用别人的内容产生的侵权意外情况等&#xff…

[MySQL]——SQL预编译、动态sql

键盘敲烂&#xff0c;年薪30万&#x1f308; 目录 一、SQL的预编译 &#x1f4d5;一条SQL语句的执行过程 &#x1f4d5;弊端 &#x1f4d5;预编译SQL的优势 &#x1f4d5;两种参数占位符 &#x1f4d5;小结 二、动态SQL &#x1f4d5;概念介绍&#xff1a; &#x1f4…

Opencv学习笔记(最近更新2023.11.1)

文章目录 棋盘格角点检测findChessboardCorners()亚像素角点检测cornerSubPix(&#xff09;棋盘格角点的绘制drawChessboardCorners()计算外参solvePnPRansac()旋转向量转旋转矩阵Rodrigues()鱼眼畸变矫正initUndistortRectifyMap()检测轮廓findContours()轮廓显示drawContours…

springboot2.x使用@RestControllerAdvice实现通用异常捕获

文章目录 demo地址实现效果引入基础类准备1.通用枚举与错误状态枚举2.定义通用返回结果3.自定义业务异常 统一异常捕获测试 demo地址 demo工程地址 实现效果 当我们输入1时&#xff0c;正常的返回通用的响应结果当我们输入2时&#xff0c;抛出异常&#xff0c;被捕获然后返回…

react-组件生命周期

一、生命周期阶段 官方文档&#xff1a;https://zh-hans.legacy.reactjs.org/docs/react-component.html React组件生命周期可分为三个阶段&#xff1a;挂载、更新、卸载 挂载&#xff1a;当组件实例被创建并插入 DOM 中时。其生命周期调用顺序如下&#xff1a; constructor()s…

【c++Leetcode】287. Find the Duplicate Number

问题入口 思想&#xff1a;Floyds Tortoise and Hare 这个算法除了可以检测是否有环&#xff08;问题入口&#xff09;&#xff0c;还可以用来检测重复数。当然这还需要一个慢指针才能实现。具体请点击标题跳转到原视频&#xff0c;这里是把内容再梳理一遍。如果有不对的地方…

Web自动化测试之图文验证码的解决方案

对于web应用程序来讲&#xff0c;处于安全性考虑&#xff0c;在登录的时候&#xff0c;都会设置验证码&#xff0c; 验证码的类型种类繁多&#xff0c;有图片中辨别数字字母的&#xff0c;有点击图片中指定的文字的&#xff0c;也有算术计算结果的&#xff0c;再复杂一点就是滑…

无测试组织:测试团队的敏捷转型

文章目录 写在前面01 从测试角度理解敏捷理念什么是敏捷&#xff1f;测试人员应该怎样理解敏捷理念&#xff1f;敏捷宣言对于测试活动的启发与思考总结如下敏捷原则12条敏捷实践框架为什么要做敏捷 02 什么是敏捷测试03 敏捷测试为什么会失败04 诊断脑暴会的成果示例测试团队转…

表格识别软件:科技革新引领行业先锋,颠覆性发展前景广阔

表格识别软件的兴起背景可以追溯到数字化和自动化处理的需求不断增加的时期。传统上&#xff0c;手动处理纸质表格是一项费时费力的工作&#xff0c;容易出现错误&#xff0c;效率低下。因此&#xff0c;开发出能够自动识别和提取表格数据的软件工具变得非常重要。 随着计算机…

使用 Python 进行自然语言处理第 5 部分:文本分类

一、说明 关于文本分类&#xff0c;文章已经很多&#xff0c;本文这里有实操代码&#xff0c;明确而清晰地表述这种过程&#xff0c;是实战工程师所可以参照和依赖的案例版本。 本文是 2023 年 1 月的 WomenWhoCode 数据科学跟踪活动提供的会议系列文章中的一篇。 之前的文章在…

【深度学习基础】专业术语汇总(欠拟合和过拟合、泛化能力与迁移学习、调参和超参数、训练集、测试集和验证集)

&#x1f4e2;&#xff1a;如果你也对机器人、人工智能感兴趣&#xff0c;看来我们志同道合✨ &#x1f4e2;&#xff1a;不妨浏览一下我的博客主页【https://blog.csdn.net/weixin_51244852】 &#x1f4e2;&#xff1a;文章若有幸对你有帮助&#xff0c;可点赞 &#x1f44d;…

linux的环境安装以及部署前后端分离后台接口

⭐⭐ linux专栏&#xff1a;linux专栏 ⭐⭐ 个人主页&#xff1a;个人主页 目录 一.linux安装环境 1.1 jdk和tomcat的安装配置 1.1.1 解压jdk和tomcat的安装包 解压jdk安装包 解压tomcat安装包 1.2 jdk环境变量配置 1.3 tomcat启动 1.4 MySQL的安装 二.部署前后端分离…

机器学习快速入门教程 Scikit-Learn实现

机器学习是什么? 机器学习是一帮计算机科学家想让计算机像人一样思考所研发出来的计算机理论。他们曾经说过,人和计算机其实本没有差别,同样都是一大批互相连接的信息传递和存储元素所组成的系统。所以有了这样的想法,加上他们得天独厚的数学功底,机器学习的前身也就孕育而生…

RHCSA -- VMware虚拟机配置及破解密码

一、配置虚拟机 1、开启VMware&#xff08;自定义&#xff09; 2、设置虚拟机硬件兼容性&#xff08;默认&#xff09; 3、稍后安装虚拟机操作系统 4、选择为Linux的虚拟机 5、虚拟机机名 6、设置虚拟机处理器 7、设置虚拟机所连接的网络类型 8、选择磁盘类型 9、设置所选磁…