ParaAT:编码蛋白质DNA序列并行比对工具
同源序列比对是生物信息学普遍采用的分析方法之一,其中,编码蛋白质DNA序列比对最为常见,在比较基因组学、分子进化学、系统发育等领域具有重要的基础作用。为获取相应的比对结果,通常采用的方法是先比对后回译(back-translate),此方法比直接进行DNA序列比对更可靠、准确。然而,现有相关的工具每次只能处理一组同源序列,无法实现多组同源序列的比对工作。
前面的一篇文章介绍了用clustal进行批量序列比对的方法,请参考《 Clustal难道不能批量运行?》。Clustal只能单纯地比对蛋白序列或者核酸序列。要想将蛋白比对结果回译成核酸序列的比对结果,需要借用其他的工具或者自己写脚本(这里给大家推荐一个脚本PAL2NAL: http://www.bork.embl.de/pal2nal/)
今天给大家推荐一款新的软件ParaAT。该软件相对于clustal+其他脚本的方法,自动化程度高,它自动先对蛋白进行比对,然后将蛋白序列结果回译成相应的核酸,实现多组同源编码蛋白质DNA序列的并行比对。ParaAT可大大降低运行时间,获得较好的并行加速比(speedup),因此,适合大规模、同源序列的比对工作。
该软件的计算方案如下:
ParaAT可在不同操作系统下运行,支持多种不同的输出格式,方便后续相关的生物信息学分析(诸如:用于检测自然选择压力的KaKs_Calculator,PAML等等)。
ParaAT下载地址:http://code.google.com/p/paraat/
相关推荐:
最新创建圈子
-
原料药研发及国内外注册申报
2019-01-25 10:41圈主:caolianhui 帖子:33 -
制药工程交流
2019-01-25 10:40圈主:polysciences 帖子:30 -
健康管理
2019-01-25 10:40圈主:neuromics 帖子:20 -
发酵技术
2019-01-25 10:39圈主:fitzgerald 帖子:17 -
医学肿瘤学临床试验
2019-01-25 10:39圈主:bma 帖子:58