用过KEGG的朋友应该都很熟悉里面的通路地图。你是否想过如果自己可以控制通路图将自己的基因绘制在一个通路图中,那么今天给大家介绍一个新推出的Bioconductor软件包pathview。这个包可以进行KEGG富集分析。
首先,我们不耐烦的介绍下Bioconductor包的安装方式:
source("http://bioconductor.org/biocLite.R")
biocLite("pathview")
pathview安装成功后载入R包出现以下信息表示安装成功:
接下来我们介绍下这个包内的函数功能以及相关的参数设置。
pathview 绘制通路图
gene.data是需要提供的基因向量,默认是Entrez_ID。其由gene.idtype决定
cpd.data 指的药物分子的名称向量。
Pathway.id指的是在KEGG中的ID。
kegg.native默认是TRUE输出完整pathway的png格式文件,反之输出仅是输入的基因列表的pdf文件。
Map.null默认是TRUE,当使用FALSE时其pdf的文件图像会更漂亮
Split.group 主要是在kegg.native为FALSE的时候会起到一定的作用,主要是将在同一个反应的基因归在一起。
new.signature=FALSE将会将标签去掉,只显示图像
总结:
1. 我们在绘图前必须先知道我们的通路ID以及所有基因对应的EntrezID
2. 通路图绘制实例
数据源:
data(gse16873.d)
data(demo.paths)
原始的kegg.native=TRUE时的图像绘制:
pv.out
demo.paths$sel.paths[1], species ="hsa", out.suffix = "gse168731",cpd.idtype ="kegg", gene.idtype =
"entrez", gene.annotpkg = NULL,min.nnodes = 3, kegg.native =TRUE,
map.null = FALSE, expand.node =FALSE,split.group =FALSE, map.symbol =
TRUE,new.signature=FALSE, map.cpdname =TRUE)
如果保存为pdf文件情况:
pv.out
demo.paths$sel.paths[1], species ="hsa", out.suffix = "gse168731",cpd.idtype ="kegg", gene.idtype =
"entrez", gene.annotpkg = NULL,min.nnodes = 3, kegg.native =FALSE,
map.null = FALSE, expand.node =FALSE,split.group =FALSE, map.symbol =
TRUE,new.signature=FALSE)
进一步如果想将所有同一个反应的基因归在一起,那么需要设置参数split.group:
pv.out
demo.paths$sel.paths[1], species ="hsa", out.suffix = "gse168731",cpd.idtype ="kegg", gene.idtype =
"entrez", gene.annotpkg = NULL,min.nnodes = 3, kegg.native =FALSE,
map.null = FALSE, expand.node =FALSE,split.group =TRUE, map.symbol =
TRUE,new.signature=FALSE)
欢迎大家学习交流