为了制造出能够解释生命多样性的标志性扭曲双螺旋,DNA规则规定G总是与C配对,A与T配对。但是,当它全部加起来时,物种中G + C与A + T含量的数量不是简单的固定百分比或标准的一对一比率。
例如,在单细胞生物体内,G + C含量可以在天然链霉菌(Streptomyces coelicolor)等细菌中的72%变化,而引起疟疾的原生动物寄生虫恶性疟原虫(Plasmondium falciparum)的含量仅为20%。
在单细胞真核生物中,酵母含有38%的G + C含量,玉米等植物含有47%,人类含有约41%。
最大的问题是,为什么?
“这一直是基因组进化中长期存在的问题之一,而之前解释它的尝试涉及相当多的挥手,”迈克尔林奇说,他是亚利桑那州立大学生物设计研究所新的进化机制中心的负责人。
DNA本身的化学性质是否有利于一个核苷酸而不是另一个核苷酸,或突变压力的偏差是否会发生变化,如果是这样,为什么物种之间会有所不同?
“在缺乏关于突变过程的关键观察结果的情况下,人们一直难以理解这种机制是什么,”林奇说。
迈克尔林奇的小组现在已经通过实验证明G + C成分通常受到强烈青睐,而这往往与相反方向的各种强度的突变压力相反。
“平均而言,自然选择或某些其他因素(可能与重组力相关)有利于G + C含量,无论DNA的种类,物种基因组的大小,或物种在生命进化树上的位置, “林奇说。
该研究发表在“自然生态学与进化”杂志上。
犯错是普遍的
驱动进化是DNA突变,基因组中的错误被引入并传递给下一代,因此随着时间的推移,为新的适应性或性状的发明提供燃料。
为了解决问题的核心,科学家想要一种方法来量化实验室中跨越大范围物种的全部DNA突变。
现在可以部分通过新技术使DNA测序更快更便宜。它推动了进化实验生物学的黄金时代。
“我们从在实验室检查的约40种物种的基因组水平上发生的突变谱的知识开始,”林奇说。“你可以使用这些信息来计算在没有选择的情况下GC成分是什么。然后我们可以将这种无效期望与实际基因组含量进行比较,差异是由于选择。”
在迄今为止最大规模调查的巡回实验中,他们检查了不同物种的每一个DNA突变,对数十亿个DNA化学碱进行了测序。
“这代表了非常大的工作量,努力和成本,这是测试具有高统计功效的不同进化模型所必需的,”负责实验的博士后研究员Hongan Long说。
他们还利用了对25个当前突变数据集的分析和12个新的突变 - 积累(MA)实验(许多来自他们自己的实验室),包括细菌和多细胞生物的动物,包括酵母,蠕虫,果蝇,黑猩猩和人类。
在每个MA实验期间,他们对大约50种不同的细菌系进行了完整的基因组测序,这些细菌系已经通过严重的单细胞瓶颈传代数千个细胞分裂。
“每条细胞的这种单细胞传代就像一个过滤器,消除了自然选择的能力,以修改除最严重和有害突变之外的所有突变的积累,使我们能够有效地无偏见地观察突变过程,”Long说。
每一代,他们都会仔细测量突变率,或者只改变一个DNA字母时的每次出现。
这可以通过两种方式发生:单个G或C DNA碱基对被转换为A + T方向;或者相反的情况可能发生,A或T基极在G + C方向切换。
在所有数字和数据处理之后,G + C含量和基于DNA突变的期望之间出现了惊人的模式。
“事实证明,它们是相关的,”林奇说道。“基于中立性,G + C的构成总是高于你的预期。这告诉我们存在普遍的选择。因此,突变驱动整体模式,但选择G和C比A和T更能将基因组含量提升到中性突变期望之上。
这似乎几乎普遍存在。“
结束了
现在他们已经展示了G + C组合的相关性,它为更多的问题打开了大门,而答案仍然是难以捉摸的。
“一个问题是,'为什么突变谱在物种间的变化如此显着'”?林奇问。“物种不具有相同的突变谱。有些物种的突变谱更富含AT,而其他物种更富含GC。我们仍然不知道突变谱中这种分歧背后的机制。”
它们可能是由于化学和生物物理学的简单差异。
可能相关的一个普遍力量是DNA稳定性,由DNA字母的化学驱动。保持DNA梯子完整的力称为氢键。G:C对涉及三个氢键,而A:T对仅涉及两个。
“流行的想法是更多的G:C含量增加了基因组的稳定性,”林奇说。
另一种可能性是在繁殖期间,当DNA链从每个亲本交织产生受精卵时,在碱基配对中可能发生错配,导致DNA校对酶后来必须修复的错误。有时,G可以变为A,或者T变成C,在这种不匹配修复过程中转换基因。
“这通常被认为偏向于Gs和Cs,”林奇说。
现在,凭借他们的实验设置,林奇的团队准备进一步探索这个伟大神秘背后的进化机制和基本力量。