Homology is the central concept for all of biology.——David Wake. Science, 1994
前言
正如前面引用的这句话,同源性是生物学中的核心问题。研究序列的同源性问题,就要用到序列比对的工具,上一篇笔记简单介绍了序列比对的原理,在这一篇中我将总结几种常用的比对工具,顺便记录一下BLAST的基本思想,由于时间关系,所以找的都是在线的工具,在未来,可能会专门写某些软件的本地化(当然我希望测试环境是在Linux上,这都是后话),比如BLAST等。
多序列比对(Multiple Sequence Alignment,MSA)
Clustal Omega
Clustal不是一个程序,而是一系列程序,这些程序用于多序列比对。
- Clustal,最初的基于系统树的比对程序
- ClustalV,Clustal的第五个版本
- ClustalW,命令行版本
- ClustalX,可视化窗口版本
- Clustal Omega,现在的官方版本
软件用C++编写,都是开源的,可在官网获取最新版本和源码。这里Clustal Omega为当前官方最新版本,提供web server版本和command line版本(GUI版本即将推出)。
程序支持蛋白质序列、DNA序列、RNA序列比对,输入的格式支持:NBRF/PIR, FASTA, EMBL/Swiss-Prot, Clustal, GCC/MSF, GCG9 RSF, and GDE。输出的格式支持:Clustal, NBRF/PIR, GCG/MSF, PHYLIP, GDE, or NEXUS。
EBI建议使用Clustal Omega进行蛋白质序列的比对,点击访问。
Muscle(MUltiple Sequence Comparison by Log- Expectation)
Muscle也是一个用于多序列比对的程序,可用于蛋白质、核酸序列的比对。它是一个开源程序可通过官网获取最新版本和源码。Muscle的web server版本由EBI提供,EBI推荐使用Muscle进行DNA序列比对,点击访问。
更多多序列比对软件
双序列比对(Pairwise Sequence Alignment,PSA)
恰巧啊,这些某个页面已经写了(偷懒)
数据库搜索
BLAST(Basic Local Alignment Seach Tool)
我觉得我再去写他的算法意义不是很大,一下是参考材料链接,后面有机会会专门写BLAST的网页和本地化的使用。
- 北京大学生信慕课
- 原始文献
这Tm写的啥子嘛,啥子卵用没用的失败的文章。沉淀些时间。