在GigaScience上发布的开源Galaxy工作流程使研究人员能够更轻松地找到基因家族;在分析物种间基因的进化,结构和功能时,这是一个重要的工具。
共同作者Wilfried Haerty解释了为什么这个工具对生物学家如此有用:“Earlham研究所开发的软件使科学家能够使用灵活且可重复的管道研究感兴趣的物种。我们的工作流程的性能评估了脊椎动物的基因组组件。各种品质(鸭嘴兽,猪,马,狗,老鼠和人)。选择该物种来评估基因组质量对基因家族鉴定的影响。小鼠,狗和人类基因组具有高质量,而其他三个是不同的分析完成阶段。“
基于并扩展Ensembl现有的EnsemblCompara Gene Trees管道,GeneSeqToFamily工作流程删除了该过程的许多复杂先决条件,例如必须使用命令行安装大量单独的工具,将整个过程转换为Galaxy;一个更简单的平台。
重要的是,工作流程可高度自定义,允许用户选择参数,更改工具并在自己的基因上运行软件,而无需使用Ensembl数据库。
GeneSeqToFamily不仅仅是一个工作流程,还包含许多新的独立Galaxy工具,包括TreeBeST,hcluster_sg,T-Coffee和ETE。该软件由数据基础设施集团的Anil Thanki和Nicola Soranzo在EI开发,使用一系列开放平台和数据库,可以更轻松地查找和生成系统发育树。科学程序员Anil Thanki说:“我们很高兴将我们的工作放在开放领域,它允许生物学家和生物信息学家在一个简单的图形用户界面中使用Ensembl Compara GeneTrees Pipeline,并在需要时对其进行修改。”
该团队希望新工作流程能够帮助不熟悉使用Compara的复杂性的用户能够更轻松地分析系统发育数据集,同时在一个Galaxy工作流程中整理许多有用的基因家族工具。用户可以选择现有的Ensembl数据库作为分析的参考集,也可以提供相同格式的数据,并提供可以提供帮助的工具。
Earlham Institute致力于提供支持,支持和开发计算生物学和生命科学研究的工具和算法,Galaxy等项目帮助开放获取一系列科学工具和数据库。
由Rob Davey博士领导的数据基础设施小组也支持CyVerse UK和COPO等资源,与Galaxy一起,通过EI的国家能力,将计算资源的可用性和可用性扩展到英国和国际上更广泛的科学界。 -Infrastructure。