EMBL欧洲生物信息学研究所(EMBL-EBI)的研究人员将细菌遗传学和网络搜索算法的知识结合起来,构建了一个用于微生物数据的DNA搜索引擎。在Nature Biotechnology上发表的一篇论文中描述的搜索引擎可以使研究人员和公共卫生机构使用基因组测序数据来监测抗生素抗性基因的传播。通过使大量数据可被发现,搜索引擎还可以让研究人员更多地了解细菌和病毒。
微生物的搜索引擎
这种名为Bitsliced Genomic Signature Index(BIGSI)的搜索引擎实现了与互联网搜索引擎类似的目的,例如谷歌。
微生物DNA测序的数量每两年翻一番。到目前为止,没有切实可行的方法来搜索这些数据。
这种类型的搜索对于理解疾病非常有用。例如,爆发食物中毒,其原因是含有抗药性质粒的沙门氏菌菌株(一种可以在不同细菌物种间传播耐药性的“搭便车”DNA元素)。BIGSI首次允许研究人员轻松发现质粒是否以及何时被发现。
谷歌和其他搜索引擎使用自然语言处理来搜索数十亿个网站。他们能够利用人类语言相对不变的事实。相比之下,微生物DNA显示出数十亿年进化的印记,因此每个新的微生物基因组都可以包含以前从未见过的新“语言”。使BIGSI发挥作用的关键是找到一种方法来建立一个能够应对微生物DNA多样性的搜索指数。
监测传染病
“我们受传染病和抗生素耐药性管理问题的驱使,”EMBL-EBI研究组组长Zamin Iqbal解释道。“我们知道细菌可以通过突变或在质粒的帮助下对抗生素产生抗性。我们也知道我们可以使用细菌DNA中的突变作为细菌血统的历史记录。这使我们能够在某种程度上推断出如何细菌可能会扩散到医院病房,国家或世界.BIGSI帮助我们大规模地研究所有这些事情。这是第一次,科学家们可以提出诸如“之前是否见过这种爆发毒株?”之类的问题。或者“这种抗药性基因是否会扩散到新物种?”。
快速简便的搜索
“这个搜索引擎补充了其他现有工具,并提供了可以扩展到我们现在生成的大量数据的解决方案,”EMBL-EBI的生物信息学家Phelim Bradley解释道。“这意味着随着数据量的不断增长,搜索将继续发挥作用。事实上,这是我们必须克服的最大挑战之一。我们能够开发出一种可以被互联网使用的搜索引擎连接。”
“随着DNA测序变得越来越便宜,我们将在基础研究之外看到全新的用户群,并且所产生的数据量也会迅速增加,”Iqbal继续说道。
“我们很可能会在诊所或现场使用DNA测序来诊断患者和开处方,但我们也可以看到它用于其他一些事情,例如检查汉堡中的肉类类型。在这一点上可以搜索基因组学数据是至关重要的,它将使我们能够学到很多关于生物学,进化,疾病传播等方面的知识。“
为什么我们关心微生物?
微生物是一种太小而无法用肉眼看到并需要显微镜的生物。“微生物”是一个通用术语,用于描述不同类型的生命形式,包括细菌,病毒,真菌等。
微生物的一小部分,主要是一些特定类型的细菌和病毒,是造成传染病的原因。当细菌能够“存活”抗生素治疗时,它们对患者来说变得极其危险。这在全世界越来越多地发生,并且被称为抗生素抗性。
通过比较多种细菌的DNA,我们可以开始了解它们是如何相关的,并研究抗生素抗性在地理和物种间传播的动态。例如,DNA分析可以帮助我们预测某种结核菌株的危险程度,以及特定菌株可能对哪种药物产生反应。