布罗德研究所(Broad Institute)的研究人员表示,他们已经开发出一种名为“CATCH”的新计算技术,可以用来为已知感染人类的任何病毒及其所有已知毒株设计分子诱饵,包括临床样本中含量较低的病毒,比如寨卡病毒。科学家们说,这种方法可以帮助全球范围内的小型测序中心更有效、更经济地进行疾病监测,从而为控制疫情提供关键信息。
这项由麻省理工学院研究生海登·梅茨基和博士后凯蒂·西德尔博士领导的新研究(“利用全面可伸缩的探针设计捕获元基因组的序列多样性”)发表在《自然生物技术》的网站上。
“宏基因组测序有潜力改变微生物的检测和表征,但需要新的工具来提高其敏感性。”在此,我们提出一种计算方法,以加强核酸捕获的富集不同的微生物类群。CATCH设计了具有指定数量的寡核苷酸的最优探针集,该探针集可以实现已知序列多样性的完全覆盖和良好的扩展。我们致力于应用CATCH在复杂的宏基因组样本中捕获病毒基因组。我们设计、合成和验证多个探针集,包括一个针对已知感染人类的356种病毒的整个基因组的探针集,”研究人员写道。
“使用这些探针集捕获的病毒平均可使病毒的独特含量增加18倍,使我们能够组装没有富集就无法恢复的基因组,并准确地保持样本内的多样性。”我们还使用这些探针集恢复尼日利亚2018年拉沙热暴发后的基因组,并改进对人类和蚊子样本中未鉴定的病毒感染的检测。结果表明,CATCH可以实现更灵敏、更经济的元基因组测序。
“基因组测序成为疾病监测的关键部分,捕捉等工具将帮助我们和其他人发现疫情,病原体产生更多的数据可以共享与更广泛的科学和医学研究社区,“基督教Matranga说,博士的这项新研究文章的第二作者加入了一个本地生物技术创业公司
科学家已经能够检测到一些低丰度的病毒通过分析所有的遗传物质在一个临床样本使用宏基因组测序。然而,根据布罗德团队的研究,这种方法经常会遗漏掉在大量其他微生物和患者自身DNA中丢失的病毒物质。
另一种方法是为特定病毒增加临床样本。为了做到这一点,研究人员使用一种基因诱饵来固定目标病毒的遗传物质,这样其他遗传物质就可以被冲走。马里兰州帕迪斯萨比提(Pardis Sabeti)实验室的科学家们成功地使用了诱饵来分析埃博拉和拉沙病毒的基因组。诱饵是一种分子探针,由短链RNA或DNA与样本中的病毒DNA片段配对而成。然而,这些探针总是针对一种微生物,这意味着它们必须确切地知道自己在寻找什么,而且它们的设计并不严谨、高效。
他们需要的是一种设计探针的计算方法,这种方法能够提供临床样本中各种微生物含量的全面视图,同时也能对寨卡病毒等低丰度微生物进行富集。
“我们想重新思考我们实际上是如何设计探测器来进行捕获的,”Metsky说。“我们意识到,我们可以用比以前更少的探针来捕获病毒,包括它们已知的多样性。”为了使其成为一种有效的监测工具,我们决定尝试一次锁定20种病毒,最终我们将已知的356种感染人类的病毒数量扩大到356种。
CATCH是“用于综合杂交的目标的紧密聚合”的缩写,它允许用户设计定制的探针集来捕获任何微生物物种组合的遗传物质,包括病毒,甚至是已知感染人类的所有病毒的所有形式。
Metsky解释说,要真正全面地运行CATCH,用户可以很容易地输入已上传到国家生物技术信息中心GenBank序列数据库的所有形式的人类病毒的基因组。该程序根据用户想要恢复的信息来确定最佳探测集,无论这些信息是病毒还是一个子集。探针序列列表可以发送到少数几个合成探针进行研究的公司之一。科学家和临床研究人员希望检测和研究这些微生物,然后可以使用像鱼钩一样的探针来捕获所需的微生物DNA进行测序,从而为感兴趣的微生物富集样本。
用CATCH设计的探针组测试显示,富集后,病毒含量占测序数据的比例是富集前的18倍,这使得该团队能够组装无法从未富集样本中生成的基因组。该研究小组通过检测30个样本来验证这种方法,这些样本的已知内容横跨8种病毒。研究人员还表示,2018年尼日利亚拉沙病毒(Lassa)爆发时,如果不进行富集,很难对拉沙病毒样本进行测序,而使用一套由catch设计的针对所有人类病毒的探针,可以“拯救”这些样本。此外,该小组还能够改进对来自患者和蚊子的未知含量样本的病毒检测。
利用CATCH, Metsky和他的同事们生成了针对寨卡病毒和基孔肯雅病毒的病毒探针子集,基孔肯雅病毒是在同一地理区域发现的另一种蚊媒病毒。除了用其他方法生成的寨卡病毒基因组外,他们使用由catch设计的探针生成的数据,帮助他们发现,在科学家能够检测到寨卡病毒之前,该病毒已经在几个地区传播了数月,这一发现可以为控制未来疫情的努力提供信息。
为了演示CATCH的其他潜在应用,Siddle使用了一系列不同病毒的样本。Siddle和其他人一直在与西非的科学家合作,建立实验室和工作流程,以便现场分析病原体基因组。西非的病毒爆发和难以诊断的发烧很常见。Siddle说:“我们希望我们在尼日利亚的合作伙伴能够有效地从不同的样本中进行宏基因组测序,而CATCH帮助他们提高对这些病原体的敏感性。”
这种方法也是一种强大的方法来调查未确诊的发烧与疑似病毒的原因。Siddle补充说:“我们对使用宏基因组测序来阐明这些病例的潜力感到兴奋,特别是在受影响的国家在当地这样做的可能性。”他指出,CATCH方法的一个优点是它的适应性。
随着新的突变被识别,新的序列被添加到GenBank,用户可以使用最新的信息重新设计一组探针。此外,虽然大多数探头的设计都是专有的,但Metsky和Siddle已经公开了他们用CATCH设计的所有探头。用户可以在CATCH中访问实际的探针序列,允许研究人员在合成探针之前探索和定制探针设计。
Sabeti和其他研究人员说,他们对渔获物提高大规模高分辨率微生物群落研究的潜力感到兴奋。他们还希望这种方法有朝一日能在诊断应用中发挥效用,将结果返回给患者,让他们做出临床决定。就目前而言,该技术在改善寨卡病毒和拉沙病毒等病毒暴发的基因组监测,以及其他需要全面了解低水平微生物含量的应用方面的潜力,令他们感到鼓舞。