基因树与家谱一样,追溯特定基因的谱系,从其深祖根到其仍然生长的分枝。通过比较基因树和物种树,它们绘制物种的进化历史,科学家可以了解哪些物种具有哪些基因,这些基因随时间获得的新功能,以及它们可能失去的功能。现在,冲绳科学技术研究生院(OIST)的科学家们已经推出了一种新工具,可以快速进行这些分析,而且不会产生计算难题。
免费的,基于网络的工具ORTHOSCOPE参考成熟的物种 树和大约250个基因组数据集来估计基因树并鉴定正交组 - 来自单个基因的一组基因,这些基因来自选择的一组物种的最后共同祖先。从头到尾,分析只需几分钟。研究人员描述了该工具和多个案例研究,在2018年12月4日发表于分子生物学和进化论的新论文中证实了其功效。
快速软件使研究人员能够识别物种基因组中是否存在基因以及存在多少拷贝。最重要的是,它可以很容易地快速推断出该基因的功能,以及其祖先的功能。
“当我们考虑基因功能时,我们需要考虑物种进化,”该研究的第一作者,海洋基因组学部门的一名科学家Jun Inoue说道,他是由佐藤纪之教授领导的。他说,基因树需要大量的时间,精力和数据来手工构建,因此在过去,许多研究已经研究了基因功能而没有这种情境化信息。通过自动估计基因树,井上的新软件可以极大地改善双边动物(包括人类)基因功能的研究。“这个软件可以比较不同基因的系统发育关系,”井上说。“我希望这个工具用于医学研究 - 它会产生很大的不同。
简化曾经困难的过程
在ORTHOSCOPE发布之前,基因组数据的集合分散在各地。构建准确基因树的能力依赖于获得足够的基因组数据,但是从网络的每个角落收集数据需要花费时间和精力。为了简化这一过程,Inoue和Satoh汇编了NCBI和Ensembl基因库的数据,以及已由海洋基因组学部门建立的大型数据库。
ORTHOSCOPE用户通过输入他们感兴趣的蛋白质编码基因的编码序列开始分析。然后他们选择四组物种中的一组 - 即Protostomia,Deuterostomia,Vertebrata或Actinopterygii-来集中他们的搜索。他们可以通过选择要采样的特定物种来进一步完善查询。给定序列数据,ORTHOSCOPE自动估计新基因树并在几分钟内提供结果。用户可以根据软件提供的默认物种树或他们自己提供的数据重新排列生成的树。
为了测试他们的新工具,Inoue和Satoh对他们自己进行了一些案例研究。例如,研究人员使用ORTHOSCOPE来确定Brachyury基因的多少拷贝,这对于脊索的发育至关重要,存在于不同的deuterostome物种中。该软件证实了研究人员在之前的一项研究中手动收集的结果,但在很短的时间内完成了这一过程。
在另一个案例研究中,科学家能够识别由于全基因组重复而进化的基因,这是脊椎动物进化史上的一个关键事件。全基因组复制基本上使祖先脊椎动物基因组的大小翻了两番,为更多随机突变和新基因功能的引入打开了大门。
这些案例研究表明,通过ORTHOSCOPE,研究人员可以不仅逐个比较基因,还可以了解它们是如何进化的,以及它们在此过程中受影响的物种。
“没有其他好的方法来估计或推断基因功能 - 这个软件可以自动,快速地完成,”井上说。“我们现在可以了解基因的整个历史。”