善用KEGG数据库挖掘目的基因

有关KEGG的分析在很多已发表的论文中都十分常见,涉及到的方向也很广泛,比如:代谢组、表观组、转录组等等。通常得到相关的基因集或者代谢物后,我们都希望能够快速了解它们的蛋白功能和涉及的调控机制,从而进一步锁定接下来关注的核心基因。

KEGG富集分析就是一种很好的手段。该分析方法是由Kanehisa实验室(Kanehisa Laboratories)在1995年开发。

 什么是KEGG数据库? 

KEGG(Kyoto Encyclopedia of Genes and Genomes)是一个包含生物信息学数据库和相关工具的综合性资源,旨在帮助研究人员理解生物系统的功能和组成。KEGG数据库包含了多种生物信息学数据,包括基因组、代谢途径、疾病和药物等信息。主要包括以下几个部分:

1

基因组数据库:

包括已知生物物种的基因组序列和注释信息。

2

代谢途径数据库:

包括生物体内代谢途径的图谱和相关基因、蛋白质等信息。

3

疾病数据库:

包括与基因和代谢途径相关的疾病信息。

4

药物数据库:

包括与基因和代谢途径相关的药物信息。

KEGG数据库还提供了一系列工具和资源,如KEGG Pathway,KEGG BRITE,KEGG Orthology等,帮助我们进行生物信息学分析和研究。

图片

进入KEGG官网的页面后我们可以看到便捷搜索框、简介与引用、KEGG子库列表以及各种分析工具等。其中,KEGG PATHWAY会是我们要重点关注的部分,点击进入后首先会看到pathway的一级分类。目前可以分为七大类,分别为:

1

代谢途径(Metabolic Pathways):

包括碳水化合物代谢、脂类代谢、氨基酸代谢、核苷酸代谢等。

2

遗传信息处理( Genetic Information Processing):

包括转录、翻译、DNA 复制、修复等。

3

环境信息处理( Environmental Information Processing):

包括信号转导、细胞周期、细胞凋亡等。

4

细胞过程(Cellular Processes):

包括细胞结构、细胞运动、细胞分裂等。

5

有机系统(Organismal Systems):

包括免疫系统、内分泌系统、循环系统、消化系统、排泄系统、神经系统等。

6

人类疾病(Human Diseases):

包括各种人类疾病的相关基因和蛋白质信息。

7

药物开发(Drugs Development):

包括各种药物的作用机制和代谢途径等信息。

图片

除此之外,页面的下方我们也可以看到更为详细的分类。KEGG目前一共有三级分类,我们常说的富集通路为第三级分类。

说到这里,大家可能会问到不同的编号有什么含义呢?或者他们的区别在哪里?

其实每个通路都由一个五位数字标识,后跟以下任意一个:map,ko,ec,rn和三字母或四字母生物代码,它们分别代表五种通路类型:

  • map编号:代表reference pathway,根据已有的知识绘制的、概括的、详尽的具有一般参考意义的代谢图。一个点同时表示一个基因,这个基因编码的酶或这个酶参加的反应

  • org编号:物种特异性通路,这里就是将K编号基因(直系同源基因,后面会介绍)换为每个物种中对应的基因

  • ko编号:KO通路中的点表示直系同源基因

  • ec编号:EC通路中的点表示相关的酶

  • rn编号:化学反应通路中的点只表示该点参与的某个反应、反应物及反应类型

这五种前缀其实都是同一张通路图,只不过高亮显示的内容不同。要注意的是KEGG各个通路并非完全独立的,而是存在着普遍的联系。而且KEGG通路的联系一般不是单纯的上下游关系,更多是重叠交错的关系。在转录组、表观组研究中我们最常见的是map编号和ko编号。

了解完KEGG数据库的基本界面信息,我们再来认识下KEGG注释结果和富集分析结果。以下是富集分析后最常见的两种文件格式。

 KEGG注释结果文件 

与富集分析不同,KEGG注释是基于基因本身比对数据库后给出对应的K号,K号表示基因,每个号代表的是所有物种的一个同源基因。

以“K00410”为例,通过K号的搜索也能查找到对应的通路图。

Entry、Symbol、Name为基本信息;Pathway表示相关的map通路,点击map号可显示对应通路图;Module表示包含这个KO条目的KEGG模块,点击链接后在模块map中相应的KO矩形会被标记为红色;Brite代表了遵循KEGG通路层次结构的KO系统的分级分类,以及BRITE数据库中的其他分类;Other DBs链接到KEGG REACTION,以及COG,GO和其他分类系统;Genes表示KEGG组织中属于这个KO组的基因;Reference、Authors、Title、Journal 为该通路图的参考文献信息。

KEGG富集分析的结果文件

通过目的基因集和背景文件,完成富集分析后我们会得到下方格式的结果文件。

图片

ID :KEGG pathway ID

Description :KEGG Pathway ID 的描述

GeneRatio :本次富集实验注释到该 KEGG Pathway 的基因数/本次富集实验注释到 KEGG Pathway 数据库的基因总数

BgRatio :基因组中能注释到该KEGG Pathway的基因数/基因组中能注释到 KEGG Pathway数据库的基因总数

pvalue :富集P value (本表格中保留 3 位小数)

p.adjust :校正后的P value (本表格中保留 3 位小数)

qvalue :富集Q value (本表格中保留 3 位小数)

geneID :富集的基因名称

Count :富集的基因个数

一般来说,通过Description列对于通路的描述可以快速锁定与研究目的相关的通路和基因。但有些通路的简单描述可能并不能满足老师的需求,此时就需要我们关注ID,即结果第一列的KEGG map号,“00190”=“map00190”。

这里我们以map00190为例,通过KEGG官网输入map号再Search可以得到更为详尽的map通路信息。

图片

图片

  • 关于导航栏:

  1. scale拉动可以调节右侧图片大小

  2. 用来通过ID或别名搜索map中对象,并可显示基因对应的ko号

  3. 可通过多个ID 和KEGG标识符搜索map中对象

  4. 按照模块选择代谢途径

  5. 光标移至图中任意圆圈显示对应的C number/化合物,方框显示ko number/基因名称,圆角矩形显示的是另外的通路图。

注:图中我们可以标注出感兴趣的蛋白、mRNA或者酶等等,标注后的图片点击上方Download即可下载。点击“Change pathway type”可切换每种通路类型以及对物种进行选择。

KEGG通路图本质是一副线框图,即由点和线构成的基因-代谢物关系图。图中的方框、箭头、圆圈等也分别代表着不同的含义,关系类型可以分为蛋白-蛋白互作关系,基因表达关系和酶-酶关系。要注意的是KEGG通路图之间并非孤立的,而是常常会标注该通路中的基因或代谢物来自或流向其它相关的通路。

富集分析常见结果图

使用KEGG数据库分析后,结果如何可视化呢?这里有些例子供大家参考。

图片

......

其中大部分图通过爱基百客云平台即可实现无代码完成,真正的小白福音,欢迎咨询哦~

相关教程:富集分析不求人,零代码可视化GO/KEGG分析结果

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/15269.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

NetSuite Intercompany COGS科目设置问题

在22年底的NetSuite多公司功能串讲中,有一个题目是Intercompany COGS科目的设置问题。近期在项目上这个问题被密集讨论。为了方便分享,所以在此摘出来独立成文。有兴趣的同学也可以翻看之前的视频。 NetSuite知识会 第8谈 多公司功能串讲 NetSuite Inter…

图论(从数据结构的三要素出发)

文章目录 逻辑结构物理结构邻接矩阵定义性能分析性质存在的问题 邻接表定义性能分析存在的问题 十字链表(有向图)定义性能分析 邻接多重表(无向图)定义性能分析 数据的操作图的基本操作图的遍历广度优先遍历(BFS)算法思想和实现性能分析深度优先最小生成…

WORD、PPT技巧

WORD技巧 编辑设置 word标题导航窗口怎么调出word2016,缩小了页面,可是怎么是竖着的一页一页排列啊?以前不是好几页横排着的么?怎么设置,求救:在Word标题栏那一行找到“视图”,点击“显示比例…

20212416 2023-2024-2 《移动平台开发与实践》第5次作业

百度地图应用 1.实验内容2.实验过程2.1 Android Studio配置2.1. 创建一个Android项目2.2 在项目中本地集成BaiduMap SDK 2.2 编写代码2.2.1 配置AndroidManifest.xml文件2.2.2 编写UI界面布局文件2.2.3 编写主函数代码2.2.4 运行结果 3.学习中遇到的问题及解决4.学习感悟与思考…

数据结构篇其三---链表分类和双向链表

​ 前言 数据结构篇其二实现了一个简单的单链表,链表的概念,单链表具体实现已经说明,如下: 单链表 事实上,前面的单链表本质上是无头单向不循环链表。此篇说明的双向链表可以说完全反过来了了。无论是之前的单链表还…

Java进阶学习笔记12——final、常量

final关键字: final是最终的意思。可以修饰类、方法、变量。 修饰类:该类就被称为最终类,特点是不能被继承了。 修饰方法:该方法是最终方法,特点是不能被重写了。 修饰变量:该变量只能被赋值一次。 有些…

智慧校园的建设思路

智慧校园建设的一个主要目的就是要打破学校内的信息孤岛,其核心是在人、流程和信息三个层面的全面整合。智慧校园应该能够为全校师生员工及校外用户提供统一的、一站式的服务渠道;能够将学校各种业务流程连接起来,实现各种应用系统的互联互通…

postgresql insert on conflict 不存在则插入,存在则更新

向一张表执行插入动作,如果插入的字段数据已存在,则执行更新操作,不存在则进行插入操作。 1、创建一张表 CREATE TABLE "user_info" ( "id" int2 NOT NULL, "name" varchar(20) COLLATE "pg_catalog&quo…

基于Tensorflow卷积神经网络人脸识别公寓人员进出管理系统

欢迎大家点赞、收藏、关注、评论啦 ,由于篇幅有限,只展示了部分核心代码。 文章目录 一项目简介 二、功能三、系统四. 总结 一项目简介 一、项目背景与意义 随着科技的快速发展和智能化水平的提高,公寓管理面临着越来越多的挑战。传统的公寓…

C++ 数据结构算法 学习笔记(32) -五大排序算法

C 数据结构算法 学习笔记(32) -五大排序算法 选择算法 如下若有多个女生的身高需要做排序: 常规思维: 第一步先找出所有候选美女中身高最高的,与最后一个数交换 第二步再找出除最后一位美女外其它美女中的最高者,与倒数第二个美女交换位置 再找出除最…

k8s-pod详解

一、Pod基本概念: 1.pod介绍: Pod是kubernetes中最小的资源管理组件,Pod也是最小化运行容器化应用的资源对象。一个Pod代表着集群中运行的一个进程。kubernetes中其他大多数组件都是围绕着Pod来进行支撑和扩展Pod功能的,例如&am…

电赛经验分享——赛前准备

⏩ 大家好哇!我是小光,想要成为系统架构师的嵌入式爱好者。 ⏩在之前的电赛中取得了省一的成绩,本文对电赛比赛前需要准备什么做一个经验分享。 ⏩感谢你的阅读,不对的地方欢迎指正。 加入小光嵌入式交流群(qq群号&…

在线人才测评在企业招聘和大学生求职中的应用场景

每年的春招秋招,都是毕业生们忙着找工作的季节,相比社招来说,春招秋招是每个毕业生务必重视的机会,大厂名企毕竟名额有限,如果找到自己心仪的职业岗位,作为毕业生就必须提前准备,深入了解招聘的…

五管OTA输入极性快速判断

做CMFB还有负反馈的时候曾经在判断输入输出极性上吃了大亏,直接做实验波形正确就是输入正端,全差分就不用考虑这么多了 和弯折,形状类似7,相同方向输入正端,相反的就是输入负端,输出也是和输入负端一个方向…

【NLP】人机对话

概念 机器翻译就是用计算机把一种语言翻译成另外一种语言的技术 机器翻译的产生与发展 17 世纪,笛卡尔与莱布尼茨试图用统一的数字代码来编写词典 1930 机器脑 1933 苏联发明家特洛阳斯基用机械方法将一种语言翻译为另一种语言 1946 ENIAC 诞生 1949 机器翻译问题…

香蕉成熟度检测YOLOV8NANO

香蕉成熟度检测YOLOV8NANO,采用YOLOV8NANO训练,得到PT模型,然后转换成ONNX模型,让OEPNCV调用,从而摆脱PYTORCH依赖,支持C。python,安卓开发。能检测六种香蕉类型freshripe freshunripe overripe…

Vita-CLIP: Video and text adaptive CLIP via Multimodal Prompting

标题:Vita-CLIP: 通过多模态提示进行视频和文本自适应CLIP 源文链接:https://openaccess.thecvf.com/content/CVPR2023/papers/Wasim_Vita-CLIP_Video_and_Text_Adaptive_CLIP_via_Multimodal_Prompting_CVPR_2023_paper.pdfhttps://openaccess.thecvf.…

ue5 中ps使用记录贴

一、快捷键记录 放大图形 ctrlalt空格 放大图形 缩小视口 ctrl空格 ctrlD 取消选区 ctrlt缩小文字 w魔棒工具 选择魔棒的时候把容差打开的多一点 二、案例 移动文字 在相应的图层选择 移动文字 修改图片里的颜色 在通道里拷贝红色通道,复制红色通道粘贴给正常图…

大模型应用商业化落地关键:给企业带来真实的业务价值

2024 年被很多人称为大模型应用的元年,毫无疑问,大模型已经成为共识,下一步更急迫的问题也摆在了大家的面前——大模型到底能够用在哪?有哪些场景能落地?怎么做才能创造真正的价值? 在刚刚过去的 AICon 全…

【排序算法】快速排序(四个版本以及两种优化)含动图)

制作不易,三连支持一下吧!!! 文章目录 前言一.快速排序Hoare版本实现二.快速排序挖坑法版本实现三.快速排序前后指针版本实现四.快速排序的非递归版本实现五.两种优化总结 前言 前两篇博客介绍了插入和选择排序,这篇博…