公众号:生信漫谈,获取最新科研信息!
生信小知识 | 如何快速确定一个物种某一个基因家族全部基因数目https://mp.weixin.qq.com/s?__biz=MzkwNjQyNTUwMw==&mid=2247486827&idx=1&sn=9fea85f8d28af3e02570235936a1f535&chksm=c0e9e89bf79e618db88f549920976231aef58297f59c6f25b2856e73c2a414e2947869ff9523&token=918065009&lang=zh_CN#rd
不断有小伙伴留言咨询如何快速确定一个物种某一个基因家族全部基因数目,那么我们需要用到pfam号去构建HMM(隐马尔可夫模型)文件。
那么我们怎么首先知道我们的基因家族的pfam号呢?今天,我将从基因家族pfam号文件,在对基因家族序列分析出发带大家快速入门了解一个基因家族。
pfam号查找01
发表的文献
一般基因家族的文献中会在方法中进行介绍,现在我们看一篇最近发表的基因家族相关的文献中的方法。
是不是非常清楚明了,如果是已经发表的可以直接参考借用就行。
02基因组数据库中获得
下面以水稻Cytochrome P450基因LOC_Os03g04530为例来查找pfam号。
是不是非常清晰明了,方便非常,一看就懂!
03
pfam网站查找
https://www.ebi.ac.uk/interpro/search/sequence/
直接点击Search进行查找pfam号就行,点击下面结果进行下一步。
我们在代表性结构域哪里直接看到p450的pfam号是PF00067,可以直接点进去下一步。
如下图所示:
直接点击红色框框出现如下图所示界面直接下载即可。
下载的HMM文件直接解压就是HMM结构文件了,但是有点需要注意的是hmm文件里HMMER3/f要换成HMMER3/b才能正常使用。
基因家族数目
01hmmsearch获取基因家族基因
前面已经得到了HMM模型文件了,下面可以直接用linux服务器直接输入代码一键获得大致的基因家族数目。
#先安装hmmer软件
conda install -c bioconda hmmer
#直接输入下面代码得到结果
hmmsearch PF00067.hmm Os.pep.fasta > p450_domain.txt
上面得到了hmmsearch-evalue:默认1e-05,小于这个数值的基因家族成员,提取目标基因的蛋白序列。
可以用tbtools软件快速提取,非常方便,省心省力。
或者在linux服务器用代码提取,也超简单方便,代码如下,需要的可以记录一下。
#先安装seqtk软件
git clone https://github.com/lh3/seqtkcd seqtkmake
#或者直接用conda安装即可
conda install -c bioconda seqtk
#直接输入下面代码得到结果
seqtk subseq Os.pep.fasta id.txt> p450-pep.fa
02cdd保守结构域分析
https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi
打开网页如下图所示,
可以查询到这些目的基因属于p450基因家族了。
小伙伴们,是不是超级方便,导师再问你这个基因家族有多少基因啊,你应该知道怎么去查找了吧,学会了吗?学会了不要忘了转发朋友圈,点赞点赞噢!
回顾往期内容
1、生物博士这些研究网站建议收藏
2、生物博士互作蛋白研究收藏网站汇总
3、Cell文章教你怎么找互作蛋白
4、超简单的比较基因组学Ka/Ks进化速率图绘制
5、超详细非模式物种GO数据库全新代码构建
6、生物研究的一些常用在线生信工具建议收藏
7、植物基因的时空表达及胁迫处理可视化网站
8、生信小白送你超好用分子克隆工具SnapGene
9、三个团队三个故事,一个基因连续三年发表三篇高水平文章
10、从西湖大学柴大教授看当代博士研究生的自我突围
11、如果浙江大学李兰娟院士在MDPI杂志发表的SCI论文结果不能复现,会怎么样?
12、为什么浙江大学李兰娟院士选择在MDPI杂志发表SCI论文
13、施一公为什么没有推荐颜宁/柴继杰成院士候选人,李兰娟推荐了谁?
14、顶尖学者纷纷加入西湖大学,颜宁什么时候加入施一公团队
15、由万建民院士Cell论文引起的一点思考和疑惑
16、清华大学施一公团队为什么选择《International Journal of Molecular Sciences》发表SCI
17、西湖大学施一公团队在国际著名杂志IJMS发表重要论文给予我们的启示
18、可以在施一公团队投稿的《International Journal of Molecular Sciences》上发表文章吗?
通过以上步骤是否学会了呢?关注我们,学习更多生信干货,原创不易,请各位多多点赞加转发朋友圈进行分享!
今天就先给大家介绍到这里,希望大家的科研能有所帮助!祝您科研顺利快乐!
生信漫谈
生信漫谈,认识生信,学习生信,跨越生信入门路上的障碍,从而利用生信技术解决科研学习路上的绊脚石!