DNA合成的速度和错误率受DNA的三维结构的影响。使用“第三代”全基因组DNA测序数据,宾夕法尼亚州立大学和捷克科学院的一组研究人员表明,有可能形成不寻常的DNA构象的序列,通常与癌症和神经疾病有关,可以在事实是减慢或加速DNA合成过程并导致更多或更少的测序错误。一篇描述该研究的文章发表在Genome Research期刊的网络版上。
“我们一直对试图了解影响基因组突变率变异的因素感兴趣,”宾夕法尼亚州立大学Pentz生物学教授,研究团队负责人之一Kateryna Makova说。“可以形成非B DNA的序列,其形成除了常见的右旋双螺旋结构,每回合10个碱基(B-DNA)之外的结构,构成人类基因组的约13%并在细胞中起重要作用。功能,包括基因调控和端粒保护 - 限制和稳定染色体末端的序列。由于这些区域也与许多人类疾病有关,我们有兴趣看看它们是否对DNA合成反应的速度有任何影响。 - 也称为“聚合” - 以及它的错误率。“
非B DNA包括具有“G”核苷酸,鸟嘌呤的序列的序列,其可以形成G-四链体结构; “A”富集区域,可导致螺旋弯曲; 和短串联重复 - 具有相同的一至六个核苷酸基序的区域一遍又一遍地重复(例如GATA GATA GATA ......) - 可以形成滑动的链和发夹。使用单分子实时测序或SMRT,在测序过程中跟踪每个连续核苷酸(A,T,C或G构建模块)的整合之间的时间,研究人员比较了非区域B DNA到B-DNA。
“预计将有数十万个序列基序在整个基因组中形成非B DNA,”宾夕法尼亚州立大学生物信息学和基因组学项目的研究生,该论文的共同第一作者Wilfried Guiblet说。“我们使用来自Pacific Biosciences的SMRT测序仪的数据来比较沿着非B DNA区域的核苷酸掺入时间与沿着更常见的B-DNA区域的核苷酸掺入时间。” 比较显示某些形式的非B DNA-G-四链体例如导致聚合酶减慢多达70%,而其他非B DNA导致酶加速。
“为了分析数据,我们开发了一种新的功能数据分析(FDA)统计工具,”宾夕法尼亚州立大学统计学教授,研究团队的另一位领导人Francesca Chiaromonte说。“这个工具将非B和B-DNA区域的核苷酸掺入时间对比,将它们视为曲线或数学函数。” Marzia Cremona,宾夕法尼亚州统计学助理教授Bruce Lindsay和该论文的另一位共同第一作者,在开发新工具和进行统计分析方面发挥了重要作用。现在可以公开获得实施测试程序的软件包。
除了核苷酸掺入时间的变化外,研究人员还指出,测序仪的错误率在某些类型的非B DNA区域中增加,例如在G-quadruplex基序中。在这些地区,错误率增加与人类DNA序列变异增加(使用“1000基因组计划”的数据),以及人类和猩猩之间的差异增加。
“为了进行测序,SMRT使用一种叫做聚合酶的酶,类似于使用聚合酶来复制DNA的细胞,”Makova说。“似乎导致测序仪错误率增加的相同现象也导致我们在人类变异和猩猩分歧中看到的增加。了解非B DNA结构如何影响突变率是非常有趣的。基因组进化的立场,也因为这些地区与人类疾病有牵连。“