生物学中最重要的问题之一是新蛋白质在生物体中的进化速度。蛋白质是实现生命基本功能的基石。随着产生它们的基因发生变化,蛋白质也会发生变化,引入新功能或特征,最终可能导致新物种的进化。
由芝加哥大学的科学家领导的一项新发表的自然生态学和进化论研究挑战了关于新蛋白质如何进化的经典假设之一。研究表明,DNA的随机非编码区段可以快速进化以产生新的蛋白质。这些从头或“从头开始”的基因提供了一种新的,未开发的方式,蛋白质进化并促进生物多样性。
“使用大的基因组比较,我们证明非编码序列可以演变成完全新颖的蛋白质。这是一个巨大的发现,”Uchicago的Edna K. Papazian杰出服务生态与进化教授,高级博士说。新研究的作者。
基因进化的第三种方式
几十年来,科学家认为新基因的进化只有两种方式:重复和分化或重组。在正常的复制和修复过程中,DNA的一部分被复制并产生基因的复制版本。然后,这些拷贝中的一个可能会获得突变,这些突变会改变其功能,使其发散并成为一个独特的新基因。通过重组,遗传物质被重新洗牌以产生新的组合和新基因。然而,考虑到构成它们的氨基酸的可能组合的总数,这两种方法仅占相对少量的蛋白质。
科学家们一直想知道第三种机制,其中从头基因可以从头开始发展。所有生物都有很长的遗传物质,不编码蛋白质,有时高达总基因组的97%。这些非编码区段是否有可能获得突然使它们起作用的突变?
这一点很难研究,因为它需要来自几个密切相关的物种的高质量参考基因组,这些物种显示祖先的非编码序列和随后从它们进化而来的新基因。如果没有这种明确的,可见的进化线,就没有办法证明它是真正的从头基因。之前报道的新基因可能只是一个“孤儿基因”,在某些时候从不相关的生物体中分离或转移,然后其前辈的所有痕迹都消失了。
为了克服这些挑战,Long的团队利用了13种新的基因组,这些基因组最近从11种密切相关的水稻植物中进行了测序和注释,其中包括最常见的粮食作物Oryza sativa。他曾与亚利桑那大学Rod Wing教授领导的小组合作。来自中国华中农业大学的Yidan Ouyang教授也带领一个团队在海南(中国南部沿海的一个热带岛屿)种植自己的水稻,并将其收获用于蛋白质组学抽样。
在分析了这些植物的基因组后,他们检测出至少175个从头基因。蛋白质活性的进一步质谱分析由位于中国广东深圳的基因组测序中心BGI-Shenzhen的Siqi Liu教授领导的另一组进行。他们发现有证据表明这些基因中有57%实际上转化为新蛋白质,包括300多种新肽。
有了这个真正的从头基因的第一个大型数据集,Long的团队在他们的进化中发现了一种模式。它始于表达的早期进化,随后突变为几乎所有从头基因的蛋白质编码潜力。
“鉴于广泛观察到的各种生物体内基因区域的表达,这是有道理的,”UChicago的博士后研究员,该文章的第一作者李章说。
Long说,Oryza植物是寻找de novo基因的良好基因组,因为它们相对年轻 - 你仍然可以在它们现有的基因组中看到进化的证据。
“这11种物种在大约三,四百万年前相互分离,所以它们都是年轻的物种,”他说。“因此,当我们对基因组进行测序时,所有序列都非常相似。它们没有累积多代变化,因此所有以前的非编码部分仍然存在。”
Long和他的团队接下来想要研究新的蛋白质,以进一步了解它们的功能和进化,看看它们的结构是否有独特之处。如果de novo基因为进化开辟了未开发的途径,它们可以揭示创造新的和改进的细胞功能的机制。例如,研究人员检测到自然选择的证据,用于修复基因组中的插入和缺失以产生新的蛋白质序列,以及序列向改进功能的演变。
“新蛋白质可以使某些功能更好,或者更好地帮助调节基因,”他说。“每一步,他们都可以为生物体带来某种益处,直到它逐渐固定在基因组中。”