我想做信号通路分析,但我就是不想学编程

“我想做信号通路分析,但我就是不想学编程。”

“我又不是生信狗,学代码会死。”

“你们这些做生信的,整天把数据分析搞得神神秘秘,不就是怕被人抢饭碗而已嘛。”

“这都没分析出我想要的结果,不靠谱。”

“你们做生信的不都是写好pipeline的吗?怎么那么久还没分析好?”

图片

图片

科研日常问题:我有一张基因/蛋白列表,想知道富集在什么通路上,如何做?

这篇文章就教大家,如何一句代码都不用敲,通过简单的复制粘贴还有点两下鼠标,就能实现通路富集的分析

Metascape

1

http://metascape.org/gp/index.html#/main/step1

Metascape的主界面长这样,操作起来非常简单,只需要按照提示,一步一步进行操作即可。数据库更新得很勤,不怕落伍。

首先在Step 1那里,粘贴你的基因列表。然后Step 2会问你是什么物种。Step 3点Express Analysis。然后就自动出结果了,输出的图片颜值很高,还能下载原始的excel表回去自己作图,还能自动导出成漂酿的成套的ppt结果汇报……是不是so easy!!!

氮素!!!

Metascape有一个不是很讨喜的地方,就是默认的Express Analysis,总是喜欢把各个数据库的信号通路混一起分析,这样很容易出现,某些非常general的数据库,就容易抢戏,出现各种冗余。比如说,下面这个结果,就是默认把Reactome、CORUM和GO数据库全部给搅在一起展示了。

图片

当然,这并不是不可破解的问题。只要在Step 3那里,点击Custom Analysis,然后在Enrichment的选项卡里,勾选你想要的数据库就好了。

图片

目前,Metascape支持不少流行的数据库,比如Hallmark Gene Sets、Reactome等,还有我最不爱用的GO和KEGG。至于其他参数是啥意思,不懂话就佛系对待吧,别改了。。。

之前在《拿到基因两眼一抹黑?没关系,先做个基因富集分析吧!》一文里除了介绍了Metascape还介绍了另外一个在线富集分析软件DAVID,网站:https://david.ncifcrf.gov/。正好本文未提到,做个补充。

Enrichr

2

如果嫌Metascape的数据库少,那就试试数据库多到上天的Enrichr吧。

http://amp.pharm.mssm.edu/Enrichr/

图片

Enrichr的界面更加清爽了,只需要你把基因/蛋白列表贴进去然后点submit就完事了。

我第一次用Enrichr就被震惊了!

图片

图片

图片

这也太多数据库了吧!!!

以上只列出了其中三页数据库,即转录调控、信号通路、基因本体,后面还有疾病/药物,细胞类型,还有一些杂七杂八的,甚至连过期数据库都有。而且数据同样支持导出。

氮素!!!

如果你用了就知道,Enrichr根本就没问你,贴的基因到底是个啥物种。因此,这个程序有个很坑的地方,就是把所有物种的数据库全部混一起分析了……比如下面这个WikiPathways分析,就把人和小鼠的结果一起展示了……(并且未知这种混合,是否会影响通路富集分析的结果)

图片

此外,由于Enrichr的数据库太多,所以更新不是很及时。比如上面展示的WikiPathways,还是2016年的,而这两年WikiPathways的更新频率几乎是月更。

ConsensusPathDB

3

http://cpdb.molgen.mpg.de/

图片

CPDB是德国人开发的,界面长这样,不算很直观。但数据库量一样很大,整合了32个数据库。想做信号通路富集分析,点左边的over-representation analysis,贴上列表,选择数据类型(到底是gene id,还是symbol,还是别的什么),然后提交就好了。

图片

下一步,就是选要用哪些数据库来分析。

图片

最好还是一次只选一个,因为不知道原始的程序设计是如何的,到底是各个数据库独立分析,还是跟metascape默认一样,全部混一起。整体而言,分析速度极快,使用起来也很方便。

氮素!!!

CPDB只支持分析人类基因……

总结

4

以上这些工具的分析结果,在调教好参数的情况下(比如p值 cut-off,数据库类型),各个网站出来的结果没太大区别,所以算法上应该都是靠谱的。我拿同一套东西跑ClusterProfiler,结果也是没差多少。

这几个数据库都有什么优缺点呢?

Metascape:支持物种多,数据库更新非常及时,且导出的数据颜值高,甚至可以直接发表。但是支持数据库较少,而且在国内打开较慢,且运行速度有时候较慢(毕竟分析完后还要生成pdf、excel、ppt还顺便打成压缩包那么一大堆东西)。

Enrichr:数据库多到上天,分析速度还行。但是不支持选择特定物种,默认就是多物种的数据库混一起的,同时部分数据库更新不够及时。

CPDB:速度快,支持非常多的数据库,更新还算勤,几个月更一次吧。但只能分析人类基因。

总体而言,Metascape还是最好用的,毕竟支持的物种比较多,人、鼠、斑马鱼、果蝇、线虫、疟原虫、酵母、拟南芥都有。虽然支持的数据库不算多,但简单过一遍分析,看看有什么通路冒出来,也算是勉强够用。

那有没有支持的物种多、数据库多、更新勤、速度快,甚至能够做非模式生物、自定义通路数据库的在线工具呢?

图片

R语言,然后琢磨一下ClusterProfiler这个神包吧。

图片

PS:我自己喜欢用的通路数据库是Reactome(没钱买KEGG怎么办?REACTOME开源通路更强大),WikiPathways,HumanCyc(虽然免费的库比较旧),还有Hallmark gene sets。虽然ClusterProfiler只有Reactome(额外再下个包),但只要去下载对应的数据库,用其中的通用enrichment分析函数enricher,就可以任性分析了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/45718.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【自学安全防御】二、防火墙NAT智能选路综合实验

任务要求: (衔接上一个实验所以从第七点开始,但与上一个实验关系不大) 7,办公区设备可以通过电信链路和移动链路上网(多对多的NAT,并且需要保留一个公网IP不能用来转换) 8,分公司设备可以通过总…

Java爬虫安全策略:防止TikTok音频抓取过程中的请求被拦截

摘要 在当今互联网时代,数据采集已成为获取信息的重要手段。然而,随着反爬虫技术的不断进步,爬虫开发者面临着越来越多的挑战。本文将探讨Java爬虫在抓取TikTok音频时的安全策略,包括如何防止请求被拦截,以及如何提高…

Andriod Stdio新建Kotlin的Jetpack Compose简单项目

1.选择 No Activity 2.选择kotlin 4.右键选择 在目录MyApplication下 New->Compose->Empty Project 出现下面的画面 Finish 完成

C++——类和对象(中)

文章目录 一、类的默认成员函数二、构造函数三、析构函数四、拷⻉构造函数五、赋值运算符重载1. 运算符重载2. 赋值运算符重载 六、取地址运算符重载const成员函数取地址运算符重载 七、应用:⽇期类实现Date.hDate.cpptest.cpp 一、类的默认成员函数 默认成员函数就…

技术成神之路:设计模式(七)状态模式

1.介绍 状态模式(State Pattern)是一种行为设计模式,它允许一个对象在其内部状态改变时改变其行为。这个模式将状态的相关行为封装在独立的状态类中,并将不同状态之间的转换逻辑分离开来。 2.主要作用 状态模式的主要作用是让一个…

数据结构—链式二叉树-C语言

代码位置:test-c-2024: 对C语言习题代码的练习 (gitee.com) 一、前言: 在现实中搜索二叉树为常用的二叉树之一,今天我们就要通过链表来实现搜索二叉树。实现的操作有:建二叉树、前序遍历、中序遍历、后序遍历、求树的节点个数、求…

MySQL日期和时间相关函数

目录 1. 获取当前时间和日期 2. 获取当前日期 3. 获取当前时间 4. 获取单独的年/月/日/时/分/秒 5. 添加时间间隔 date_add ( ) 6. 格式化日期 date_format ( ) 7. 字符串转日期 str_to_date () 8. 第几天 dayofxx 9. 当月最后一天 last_day ( ) 10. 日期差 datedif…

H. Beppa and SwerChat【双指针】

思路分析&#xff1a;运用双指针从后往前扫一遍&#xff0c;两次分别记作数组a&#xff0c;b&#xff0c;分别使用双指针i和j来扫&#xff0c;如果一样就往前&#xff0c;如果不一样&#xff0c;i–,ans #include<iostream> #include<cstring> #include<string…

SQL server 练习题2

课后作业 作业 1&#xff1a;自己查找方法&#xff0c;将 homework_1.xls 文件数据导入到 SQLServer 的 homework 数据库中。数据导入完成后&#xff0c;把表名统一改为&#xff1a;外卖表 如下所示&#xff1a; 作业 2&#xff1a;找出所有在 2020 年 5 月 1 日至 5 月 31 …

Zookeeper之CAP理论及分布式一致性算法

CAP理论 CAP理论告诉我们&#xff0c;一个分布式系统不可能同时满足以下三种 一致性&#xff08;C:consistency&#xff09;可用性&#xff08;A:Available&#xff09;分区容错性&#xff08;P:Partition Tolerance&#xff09; 这三个基本要求&#xff0c;最多只能同时满足…

部署k8s 1.28.9版本

继上篇通过vagrant与virtualBox实现虚拟机的安装。笔者已经将原有的vmware版本的虚拟机卸载掉了。这个场景下&#xff0c;需要重新安装k8s 相关组件。由于之前写的一篇文章本身也没有截图。只有命令。所以趁着现在。写一篇&#xff0c;完整版带截图的步骤。现在行业这么卷。离…

SpringBoot中常用的注解及其用法

1. 常用类注解 RestController和Controller是Spring中用于定义控制器的两个类注解. 1.1 RestController RestController是一个组合类注解,是Controller和ResponseBody两个注解的组合,在使 用 RestController 注解标记的类中&#xff0c;每个方法的返回值都会以 JSON 或 XML…

【Android安全】Ubuntu 下载、编译 、刷入Android-8.1.0_r1

0. 环境准备 Ubuntu 16.04 LTS&#xff08;预留至少95GB磁盘空间&#xff0c;实测占94.2GB&#xff09; Pixel 2 XL 要买欧版的&#xff0c;不要美版的。 欧版能解锁BootLoader、能刷机。 美版IMEI里一般带“v”或者"version"&#xff0c;这样不能解锁BootLoader、…

394. 字符串解码 739. 每日温度(LeetCode热题100)

394. 字符串解码 - 力扣&#xff08;LeetCode&#xff09; curr_str&#xff1a;遍历整个字符串时 如果左边有[&#xff0c;且无相应右括号和其匹配&#xff0c;那么curr_str就表示该[到当前位置的解码字符串如果左边的[]已经匹配&#xff0c;或者没有[]&#xff0c;curr_siz…

找不到vcruntime140_1.dll 无法执行的相关解决方法,如何高效率修复vcruntime140_1.dll

当出现“找不到 vcruntime140_1.dll 无法执行”这类提示时&#xff0c;意味着你的系统中的 vcruntime140_1.dll 文件已经缺失或者损坏。为了恢复并正常启动你的程序&#xff0c;你需要对这个 DLL 文件进行修复。接下来&#xff0c;我们将详细介绍如何进行这一操作。 一.找不到v…

数学建模·层次分析法

层次分析法 LAF 定义 评价体系的优劣影响&#xff0c;计算评价指标的权重的一种方法 主观性较强&#xff0c;现在一般不用 主要步骤 关键在于一致性检验和求权值 权重的计算 注意权重之和为1&#xff0c;需要归一化 算数平均法 特征值法 矩阵的一致性检验 为什么要检验…

sentinel网关限流配置及使用

sentinel控制台源码&#xff1a;https://download.csdn.net/download/yixin605691235/89543923 sentinel控制台jar包&#xff1a;https://download.csdn.net/download/yixin605691235/89543931 不同环境直接修改jar包中的application.yml文件中的nacos地址就可以了。 一、网关限…

大数据信用查询有哪些问题值得注意呢?

随着大数据技术的不断发展&#xff0c;大数据信用报告成为一种新型的信用风险检测工具&#xff0c;被很多的银行和机构广泛用于信用风险评估&#xff0c;那大数据信用查询有哪些问题值得注意呢?本文就带大家一起去了解一下&#xff0c;希望对你有一定的帮助。 大数据信用查询这…

python 方向梯度直方图(HOG)算法 【附两种实现方法并可视化】

目录 一、概述1.1 算法定义1.2 实现过程二、方法1(skimage库)2.1 代码实现2.2 结果示例三、方法2(cv2库)3.1 代码实现3.2 结果示例四、结果对比🙋 结果预览 一、概述 1.1 算法定义 方向梯度直方图(Histogram of Oriented Gradient,HOG):是应用在计算机视觉和图像处…

LLM微调

文章目录 一. 常见微调分类1.1 全量微调&#xff08;FFT&#xff1a;Full Fine-tuning&#xff09;1.2 参数高效微调(PEFT&#xff1a;Parameter-Efficient Fine-Tuning)1.3 指令微调&#xff08;IFT&#xff1a;Instructional Fine-tuning&#xff09;1.3.1 Hard prompt1.3.2 …