像其他专业人士一样,科学家们喜欢做他们所做的最好的事情,但他们也喜欢在工作中享受乐趣。并且在2018年,我的同事们在声称解码世界上最长的DNA序列的记录方面做到了这一点。对于所涉及的英国科学家来说,也许最重要的事实是他们的DNA读数大约是他们的澳大利亚竞争对手持有的前一记录的两倍。获得记录的荣耀是灰烬式竞争产生更长DNA 序列的结果。在过去的一年中,该记录曾多次交手,但凭借这一新的序列,奖杯似乎在英国是安全的 - 至少目前是这样。
但令人兴奋的是,这个记录最令人鼓舞的是科学和未来的应用程序,因为我们能够解码更长的序列。
拼图混乱
自千年时代解码第一个人类基因组以来,科学家能够读取DNA序列的技术已经走过了漫长的道路。现在有许多方法可以读取DNA,但问题是许多动物和植物基因组通常是数十亿个碱基对(称为A,T,G和C的DNA构建块对),所以理解它们是棘手。人们过去曾使用过不同的方法,但基本上他们所做的就是将DNA分成小部分,阅读每一部分,然后尝试将结果重新组合在一起,有点像你用拼图游戏做的事情。
因此,在DNA测序方面,将DNA片段以正确的顺序放在一起是一个主要障碍。你拥有的碎片越多越明显越难,特别是如果它们很短并且非常相似。
因此,能够连续阅读更长的片段 - 最终一次完整的染色体 - 将对科学和创新产生巨大影响。在我自己的研究中,我有兴趣找到决定动物体左侧和右侧的基因。虽然我可以相当直接地阅读像“杰里米”这样的蜗牛基因组- 它有一个向左而不是向右盘旋的外壳 - 很难理解它,因为它的顺序几乎完全是混乱的。
同样在诺丁汉大学的同事马特·洛斯(Matt Loose)带领团队支持新的世界纪录,该记录一次性读取人类DNA的230万碱基。把它放在上下文中,在最常见的DNA测序形式中,一次只读取几百个碱基,产生数百万个片段。如果几百个基地相当于一次大奖赛赛道,那么一个2.3米碱基对的读数是围绕地球周长的两倍。相比之下,Kinghorn临床基因组学中心的主要竞争对手澳大利亚队仍落后一步。他们仍然需要在世界各地获得一次。
长读和小孔
推动这些进步的关键技术是一个非常小的孔,称为纳米孔。DNA碱基或字母通过纳米孔进行棘轮攻击,并且可以通过监测通过它的电流的中断来读取顺序。如果纳米孔的尺寸缩小到拇指和食指的大小,那么科学家们就会穿过长度超过7公里的绳索穿过洞,而不会缠结或破裂。相比之下,更典型的DNA序列长度约为半米。
理论上,使用这种方法可以一次性对整个染色体进行测序。这样可以避免尝试组装大型拼图的问题。但每条染色体的自然断裂意味着这可能是不可能的。无论读取长度的实际限制是什么,新方法已经被用于更快速且成本有效地识别疾病爆发中的病原体。相同的方法也被用于快速和准确地表征随着细胞发展成癌变而发生的基因组重排。
最近提出的对1.5m已知动物,植物和真菌物种的基因组进行测序的提议也将受益于这些新的长读技术。将来,这些方法将有助于实现真正个性化的医学 - 对我们的个体基因组进行测序。在英国,大约有85,000人已经阅读了他们的整个遗传密码,并希望在未来五年内对100万个基因组进行测序。目前,大多数情况是使用较旧的短读技术完成的,这种技术仍然更便宜但却错过了一层重要的结构信息。
在我自己的实验室中,我计划使用相同的方法来找到有时使蜗牛存在于自身的两个镜像版本中的基因。相同的方法也可用于进一步揭示人类疾病的遗传学,特别是那些由于结构重排和基因拷贝数变化引起的遗传学。
记录背后的科学家认为,他们的记录可能会持续一年左右。竞争正在扩大,包括其他竞争对手 - 就在上个月,来自荷兰的新进入者在一个击败英国记录的过程中崭露头角。
但考虑到利害关系,激烈的竞争只会是一件好事。