ParaAT:编码蛋白质DNA序列并行比对工具

楼主  收藏   举报   帖子创建时间:  2018-09-18 00:00 回复:0 关注量:153

同源序列比对是生物信息学普遍采用的分析方法之一,其中,编码蛋白质DNA序列比对最为常见,在比较基因组学、分子进化学、系统发育等领域具有重要的基础作用。为获取相应的比对结果,通常采用的方法是先比对后回译(back-translate),此方法比直接进行DNA序列比对更可靠、准确。然而,现有相关的工具每次只能处理一组同源序列,无法实现多组同源序列的比对工作。

前面的一篇文章介绍了用clustal进行批量序列比对的方法,请参考《 Clustal难道不能批量运行?》。Clustal只能单纯地比对蛋白序列或者核酸序列。要想将蛋白比对结果回译成核酸序列的比对结果,需要借用其他的工具或者自己写脚本(这里给大家推荐一个脚本PAL2NAL: http://www.bork.embl.de/pal2nal/

今天给大家推荐一款新的软件ParaAT。该软件相对于clustal+其他脚本的方法,自动化程度高,它自动先对蛋白进行比对,然后将蛋白序列结果回译成相应的核酸,实现多组同源编码蛋白质DNA序列的并行比对。ParaAT可大大降低运行时间,获得较好的并行加速比(speedup),因此,适合大规模、同源序列的比对工作。

该软件的计算方案如下:


编码蛋白质DNA序列并行比对工具—ParaAT

ParaAT可在不同操作系统下运行,支持多种不同的输出格式,方便后续相关的生物信息学分析(诸如:用于检测自然选择压力的KaKs_Calculator,PAML等等)。

ParaAT下载地址:http://code.google.com/p/paraat/

相关的论文:Zhang, Z. et al. (2012) ParaAT: A parallel tool for constructing multiple protein-coding DNA alignments, Biochem Biophys Res Commun, 419, 779-781.