在一项新发表的研究中,研究人员描述了一种机制,通过该机制,DNA的随机非编码区可以快速进化,从而“从头开始”产生新的蛋白质。据作者说,这是第一次直接观察到这种类型的进化。该研究由芝加哥大学医学中心的研究人员进行,今天发表在Nature Ecology and Evolution上。
一段时间以来,科学家们认为只有两种方法可以让新基因进化:重复和分化或重组。当DNA的一部分被复制并在正常复制和修复事件期间创建基因的复制版本时,会发生重复和发散。然后,这些拷贝中的一个可以获得改变其功能的突变,足以使其成为独特的新基因。在重组中,重组洗涤遗传物质以产生新基因。
科学家已经推理出第三种机制,通过这种机制,从头构成我们基因组很大一部分的非编码区扩展出来,但这很难研究,因为它需要来自几个密切相关物种的高质量参考基因组。这表明祖先的非编码序列和从它们进化而来的新基因。没有这样的模型,就没有办法证明已经发现了一种真正的从头基因。
对于目前的研究,研究人员利用了最近从11个密切相关的水稻植物中测序的13个基因组。这11个物种相对最近(大约三四百万年前)相互分离,使它们成为追踪基因进化和识别祖先非编码区的理想主题。
对水稻植物基因组的分析揭示了至少175种从头基因。蛋白质活性的质谱分析由另一组在位于中国广东深圳的基因组测序中心进行。他们发现有证据表明这些基因中有57%转化为新的蛋白质,包括300多种新肽。
利用这一数据集,研究人员能够追踪蛋白质的进化,从表达的早期进化到随后几乎所有从头基因的突变成蛋白质编码潜力。
在未来,研究人员计划进一步研究新蛋白质,以了解它们的功能和进化,看看它们的结构是否有独特之处。