自从加州大学圣塔克鲁兹分校的研究小组宣布他们已经在互联网上组装并发布了第一个人类基因组序列以来,已有近二十年的历史。尽管时间流逝,我们的基因组参考图仍然存在巨大差距。这些间隙跨越每个人类着丝粒。
来自杰克巴斯金工程学院的UC Santa Cruz Genomics Institute附属团队刚刚发表在Nature Biotechnology杂志上的一项新研究试图缩小这些差距。该研究使用纳米孔长读序列来生成人类Y染色体着丝粒的第一个完整且准确的线性图。人类遗传学和基因组学的这一里程碑标志着科学家在完成人类基因组时最终进入技术阶段将成为现实。
着丝粒是我们遗传物质中的一个位点,致力于确保在细胞分裂时我们的基因组被正确分割。如果着丝粒丢失或损坏,则生命失去平衡,每个子细胞中的DNA过多或过少。这可能是灾难性的,常见于癌症。
科学家仍然不明白基础DNA如何促进着丝粒功能。到目前为止,无法通过这些区域生成地图一直是研究中的一个基本障碍,旨在了解缺失序列如何影响我们的健康。
已知跨越人类着丝粒的DNA充满了串联重复序列。也就是说,发现相同序列的精确拷贝 - 以头对尾的方向 - 数千次。这些精确的拷贝通常跨越数百万个碱基 - DNA的基本单位。
该出版物的通讯作者Karen Miga博士解释说,研究人员称这些重复丰富的代码区域为“基因组的黑洞”,“蓝天拼图”和“镜子大厅”。
Miga指出,“在我们工作之前,没有序列技术或序列技术的集合足以确保通过这些区域正确组装。”
这项工作的一个关键方面是作者使用一种方法来生成长(数十万个碱基)和高质量的序列。联合主要作者,加州大学圣克鲁兹纳米孔组的博士后研究员Miten Jain表示,数量和质量对于在Y染色体上自信地组装这些以前未解决的,重复富集的着丝粒区域至关重要。
“以前,没有测序技术能够组装着丝粒区域,因为需要极高质量的长读取来自信地穿越低拷贝序列变体,”Jain说,结果,人类着丝粒区域即使是最完整的也不存在染色体组装。
这些“基因组的黑洞”包含的信息对于理解基因组生物学在健康和癌症等疾病中的作用至关重要,共同主要作者Hugh Olsen解释说,他是加州大学圣克鲁兹分校科学家和纳米孔组织的讲师。通过NIH资助,研究团队继续改进纳米孔测序技术的阅读长度。“与其他研究人员合作,我们正在利用这些知识解决基因组中未表征的区域,”Olsen解释道。
米加博士表示,她希望这项研究能够标志着人类遗传学和基因组学新时代的开始,因为基因组参考中的缺口将不再被容忍。“我们正处于一个完整基因组的轨道上。一方面,我期待有一天能够卷起袖子研究这些神秘序列的功能。”