云平台教程 | 手把手教你GSEA富集分析和解读

·  爱基百客云平台小工具使用

    1.1 爱基百客云平台之GSEA分析

    1.2 GSEA富集分析原理图

    1.3 GSEA富集分析过程

    1.4 参数设置

    1.5 任务查看

    1.6 结果

         1.6.1 富集结果表格

         1.6.2 富集可视化图解读

01

爱基百客云平台小工具使用

首先,打开爱基百客官网:http://www.igenebook.com;点击菜单栏最右侧“云平台”按钮。

图片

弹出云平台界面(下图),输入账号、密码和验证码方可登录;进入云平台,可以轻松实现多种组学数据的分析和可视化,实现真正的“零代码、无门槛、操作简单”!

图片

登陆后,如下图,我们进入到小工具专栏。当前云平台已上线了32款小工具供大家使用,包括基础绘图,高级绘图,差异检验,聚类分析,序列处理等子模块,本着用户至上的理念,平台小工具将会持续更新维护,积极接受用户的反馈和意见。

图片

1.1 

爱基百客云平台之GSEA分析

上期我们讲到了富集分析。那本期我们就接着来聊一聊富集分析里面的新星:GSEA(Gene Set Enrichment Analysis)富集分析。

常规的富集分析,通过log2fc筛选差异基因,将筛选差异基因的标准聚集在单个基因的差异表达上,可能会错过真正具有生物学含义的基因群差异。于是我们可以选择进行GSEA富集分析。GSEA集富集分析有以下几个优点:

1. 全局视角:GSEA不仅关注单一基因的差异,而是关注一组基因集合的整体行为,这使得它能揭示生物学过程的整体模式,而不仅仅是局部变化。

2. 生物意义:通过预定义的基因集,GSEA提供了生物学意义的验证,比如特定通路的活动,这有助于理解基因表达变化背后的生物学背景。

3. 适应复杂数据:GSEA可以处理复杂的数据分布,如连续的基因表达数据,而不仅仅是二元的上调或下调状态。

1.2 

GSEA富集分析原理图

图片

1.3 

GSEA富集分析过程

1. 计算富集分数(ES) 富集分数:S 反应基因集(比如某个通路内的基因集)成员 s 在排序基因集 L(比如根据 logFC 排序的差异基因集,默认降序,所以上调基因在顶端)的两端富集的程度。富集得分 ES 最后定义为最大的peak值。正值ES表示基因集 S 在基因集 L 的顶部富集,负值ES表示基因集 S 在基因集 L 的底部富集。

2. 估计富集分数的显著性水平:因为每个基因集的大小不同,而 ES 又和基因集大小有关,因此需要对其进行 normalization。为了检验每个基因集的 NES 是否显著,将总基因集 L 随机打乱排列一定次数,每次都计算每个基因集的 NES(ES),得到每个基因集的 NES 在随机排序情况下的理论分布,从而计算其 p 值。

3. 矫正多重假设检验 FDR 则是对 p 值进行 BH 校正之后的 p 值。

爱基百客云平台提供了GSEA分析小工具:http://124.71.149.47:5000/smalltools/detail?id=1638074560383299585。如果您在我司做过项目,直接输入差异分析表格和基因组名称即可一键式完成富集分析。

下面我们进行GSEA富集分析实操练习。

首先点击小工具GSEA富集分析。

图片

右侧的工具介绍和常见问题对富集分析小工具的主要用途,使用方法以及结果解读做了详细的说明。左侧是必要的输入文件和参数选项。任务名称和任务编号系统会自动生成。后面可用于记录查看具体的任务。小工具提供了示例文件给用户做测试分析。同时,该页面还提供了一些常用参数调节选项。您也可进行自定义,后面将详细介绍。输出名自定义,默认Enrich。

图片

1.4 

参数设置

输入文件:支持txt(制表符分隔)文本文件,以及Excel专用的xlsx格式,同样支持旧版Excel的xls(Excel 97-2003 )格式。

差异基因表格必须包含Gene列和logFC列。如下表所示:

图片

如果文件已经上传过,您可以直接点击选择按钮找到需要的文件勾选确定,无须再次上传。

物种选择项目中所使用的基因组名称;富集类型支持GO和KEGG;基因列和logFC列的名字根据输入表格的信息填写;显著性阈值您可根据实际情况进行筛选,默认是p.adjust < 0.05;绘图个数默认选取排名靠前的10个通路绘制,你可自行选择需要展示前多少个;输出名自定义即可。

填写好上述所有的参数后,点击提交即可。

1.5 

任务查看

您可在任务管理栏中查看任务的运行情况和结果。默认情况下新任务将会在最上方展示。也可通过任务名、任务编码、日期点击查询,找到需要的任务。如下图:当状态成功时,表示任务成功结束。

图片

点击下载按钮可直接打包下载全部结果。点击查看按钮可在线查看结果。

图片

您可在在线查看结果后选择是否下载保存。另外如果结果较多时,结果展示区还可通过点击左侧或右侧的箭头进行图片切换。您可挑选自己感兴趣的结果图片进行下载保存。

图片

1.6 

结果

输出结果包含GSEA富集总表和若干通路的GSEA富集图。

1.6.1 

富集结果表格

图片

  • ID:通路名

  • Description:通路描述信息

  • setSize:该通路中包含表达数据集文中的基因数目(经过条件筛选后的值)

  • enrichmentScore:富集分数

  • NES:标准化后的富集分数

  • pvalue:是对 ES 的统计学分析,用来表征富集结果的可信度

  • p.adjust:是多重假设检验校正之后的 p-value

  • qvalues:是多重假设检验(FDR法)校正之后的 p-value,即对NES可能存在的假阳性结果的概率估计。GSEA 对显著性的定义为 p-value<5%,FDR q-val<25%

  • rank:当 ES 最大时,对应基因所在排序好的基因列表中所处的位置

  • leading_edge:tags 表示核心基因占该通路基因集的百分比;list 表示核心基因占所有基因的百分比;signal,将前 2 项统计值结合在一起计算出的富集信号强度

  • core_enrichment:核心富集基因集

1.6.2 

富集可视化图解读

图片

富集图一共分为上中下 3 部分。如A_VS_B差异分析:

  • 第一部分 ES 折线图:显示了当分析沿着排序基因集按排序计算时,ES 值在计算到每个位置时的展示。最高峰处的ES得分 (垂直距离 0.0 最远)便是基因集的 ES 值。

  • 第二部分 hits 图,俗称条形码图,用线条或者 hit 标记了通路基因集(基因组所有)中成员出现在基因排序列表中的位置。如果基因集里的基因 集中在所有基因的前部分,就是在A组里面富集,如果集中在后面部分,就是在B组里面富集。leading edge subset 就是(0,0)到绿色曲线峰值 ES 出现对应的这部分基因(x轴0到虚线那部分)。所谓 Leading-edge subset,就是对富集得分贡献最大的基因成员。如果ES得分都是正值(如上图所示),那么Leading-edge subset就在峰值ES的左侧,反之则在右侧(底部富集 = A/B 下调表达 = B 组高表达)。那么根据本图我们很容易看出,该通路在 A 组高表达。

  • 第三部分是排序后所有基因 rank 值的分布,热图红色部分对应的基因在 A 组高表达,蓝色部分对应的基因在 B 组高表达,每个基因对应的信噪比(Signal2noise,前面选择的排序值计算方式)以灰色面积图展示。

如果常规富集没有拿到预期的结果,大家完全可以拿GSEA再分析一次,说不定有惊喜哦。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/844125.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

STM32——启动文件选择及启动文件宏定义

文章目录 前提&#xff1a;以STM32F1xx系列芯片为例&#xff08;有方法&#xff0c;其他系列一样&#xff09;启动文件选择对应启动文件的寻找方法对应宏定义#define的寻找方法另外 前提&#xff1a;以STM32F1xx系列芯片为例&#xff08;有方法&#xff0c;其他系列一样&#x…

时间|基于SprinBoot+vue的时间管理系统(源码+数据库+文档)

时间管理系统 目录 基于SprinBootvue的时间管理系统 一、前言 二、系统设计 三、系统功能设计 1管理员功能模块 2用户功能模块 四、数据库设计 五、核心代码 六、论文参考 七、最新计算机毕设选题推荐 八、源码获取&#xff1a; 博主介绍&#xff1a;✌️大厂码农…

VMware vSphere Distributed Services Engine 和利用 DPU 实现网络加速

VMware相关学习专栏&#xff1a;虚拟化技术 vSphere 8.0 通过加速数据处理单元 (DPU) 上的网络功能实现了突破性的工作负载性能。 vSphere 8.0 通过加速 DPU 上的网络功能实现了突破性工作负载性能&#xff0c;从而满足现代分布式工作负载的吞吐量和延迟需求。借助 vSphere Dis…

物联网都有什么优缺点?——青创智通

工业物联网平台解决方案 物联网&#xff0c;这个曾经似乎遥不可及的科技概念&#xff0c;如今已逐渐渗透到我们生活的方方面面。从智能家居到智能工业&#xff0c;从智能医疗到智能城市&#xff0c;物联网技术正在改变着我们的世界。 然而&#xff0c;正如任何一项技术一样&a…

解决 git:OpenSSL SSL_read: SSL_ERROR_SYSCALL, errno 0

解决 git&#xff1a;OpenSSL SSL_read: SSL_ERROR_SYSCALL, errno 0 问题 git pull报错&#xff1a;fatal: unable to access ‘https://github.com/aircrushin/ultrav-music.git/’: Failed to connect to github.com port 443 after 21077 ms: Couldn’t connect to serve…

IPv4组播——组播IP,MAC地址,组播网络基本架构

目录 一.组播的好处 二.组播实现原理 1.组播IP地址 2.组播MAC地址 &#xff08;1&#xff09;前24位 &#xff08;2&#xff09;第25位 &#xff08;3&#xff09;低23位 三.组播网络基本架构 1.源端网络 2.组播转发网络 3.成员端网络 四.组播服务类型 根据组播源…

2024长三角快递物流展即将亮相,致鸿物流器材有限公司值得关注

广东致鸿物流器材有限公司&#xff0c;前身为广州致鸿物流器材有限公司&#xff0c;成立于2002年初&#xff0c;是一家中国专业仓储笼研发制造公司&#xff0c;公司员工约400名&#xff0c;日产仓储笼制造规模近8000个&#xff0c;在全国范围内有五大配送服务中心&#xff1a;江…

一次收获颇丰的Google漏洞挖掘旅程

本文由安全专家Henry N. Caga于2024年03月23日发表在InfoSecWrite-ups网站&#xff0c;本文记录了Henry N. Caga的一次漏洞挖掘过程&#xff0c;此次漏洞挖掘的成果得到了Google官方认可&#xff0c;拿到了4133.70美元的漏洞奖金&#xff0c;并让他成功进入了Google名人堂。本文…

数组和特殊矩阵的压缩存储

文章目录 一维数组二维数组特殊矩阵对称矩阵三角矩阵三对角矩阵稀疏矩阵三元组法十字链表法 一维数组 以一维数组A[0...n-1]为例&#xff0c;其存储结构关系式为 LOC ⁡ ( a i ) LOC ⁡ ( a 0 ) i L ( 0 ⩽ i < n ) \operatorname{LOC}\left(a_i\right)\operatorname{LO…

自动化使用 ChatGPT 生成 PPT 大纲 - 基于 Python 和 PyAutoGUI

这篇文章将指导您利用 Python 的 pyautogui 库创建一个自动化的脚本&#xff0c;帮助您使用 ChatGPT 生成公司智能管理平台的 PPT 大纲。该脚本将打开 Chrome 浏览器&#xff0c;访问 ChatGPT 并输入相应的提示词&#xff0c;让 ChatGPT 为您创建 PPT 大纲。 C:\pythoncode\ne…

QGis3.34.5工具软件保存样式,软件无反应问题

在使用QGis软件保存SLD样式的时候&#xff0c;每次保存样式&#xff0c;软件都进入无反应状态&#xff0c;导致无法生成样式文件 百度中多次查询问题点&#xff0c;终未能在在3.34.5这个版本上解决问题。 考虑到可能是软件本身问题&#xff0c;于是删除了3.34.5这个版本&#x…

SAP ABAP MD04屏幕增加:增加列

需求:增加显示销售订单送达方 主要使用二代增强出口:M61X0002 事务码T-code:CMOD 填写描述,保存到对应的包下 分配增强到项目下 激活组件,激活后效果如下 编写ZXM61U04 SAP留出的按钮,填写描述 button1_ez = 送达方. 编写ZXM61U03 *&-------------------------…

Java版招投标管理系统源码:优化流程,提升效率,实现全方位项目管理

在现今日益竞争激烈的招标市场中&#xff0c;企业需要一款强大而灵活的招投标管理系统来优化流程、提升效率。我们的招投标管理系统正是为此而生&#xff0c;它集门户管理、立项管理、采购项目管理、公告管理、考核管理、报表管理、评审管理、企业管理、采购管理和系统管理等多…

解决git status提示error bad signature 0x00000000

问题描述&#xff1a; 操作git的时候电脑卡了&#xff0c;重启电脑后git status就提示bad signature 0x00000000&#xff0c;index file corrupt错误&#xff0c;如下&#xff1a; 解决办法&#xff1a; rm -f .git/index git reset

【赠书第25期】C#项目开发实战(微视频版)

文章目录 前言 1 项目构思与需求分析 1.1 项目构思 1.2 需求分析 2 系统设计 2.1 系统架构设计 2.2 数据库设计 2.3 接口设计 3 编码实现 3.1 环境搭建 3.2 编码规范 3.3 编码实现 4 测试与部署 4.1 单元测试 4.2 系统测试 4.3 部署与上线 5 总结与展望 6 推…

代码随想录算法训练营第五十四天||392.判断子序列、115.不同的子序列

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 一、392.判断子序列 思路 二、115.不同的子序列 思路 一、392.判断子序列 给定字符串 s 和 t &#xff0c;判断 s 是否为 t 的子序列。 字符串的一个子序列是…

力扣算法之1070. 产品销售分析 III

力扣传送门 题解 选出每个售出过的产品 第一年 销售的 产品 id、年份、数量 和 价格&#xff0c;很明显就是个排序问题 我的解 SELECT product_id,year as first_year,quantity,price FROM ( SELECT sale_id,RANK() OVER(PARTITION BY product_id ORDER BY [year] asc ) A…

TinyChat: Visual Language Models Edge AI 2.0

TinyChat: Visual Language Models & Edge AI 2.0 要点 了解TinyChat和AWQ最新的技术发展。在边缘部署语言理解模型(LSTM)后&#xff0c;借助于视觉语言模型(VLM)&#xff0c;可以为LLM提供更好地处理图像输入的能力&#xff0c;从而极大方便了文字对话问答、图片标题生成…

C#中结构struct能否继承于一个类class,类class能否继承于一个struct

C#中结构struct能否继承于一个类class&#xff0c;类class能否继承于一个struct 答案是&#xff1a;都不能。 第一种情行&#xff0c;尝试结构继承类 报错&#xff1a;接口列表中的类型"XX"不是接口interface。 一般来说&#xff0c;都是结构只能实现接口&#x…

【第四节】C++的派生与继承

目录 一、继承特性 二、派生类的定义格式 三、派生类的继承方式 3.1 三种继承方式概述 3.2 接口继承和实现继承 四、派生类的构造和析构函数 五、类的成员重定义 六、多重继承 6.1 多继承 6.2 多继承中的二义性问题 七、虚基类 八、总结 一、继承特性 在生物学中&a…