少数土壤中的微生物数量超过银河系中的恒星数量,但研究人员对地球上的数据知之甚少,因为他们最近才有深入探索地下的工具。现在美国能源部联合基因组研究所(DOE JGI)的科学家,DOE科学用户设施办公室,在揭示地球微生物多样性方面迈出了决定性的一步。在2017年6月12日发表在Nature Biotechnology上的一篇论文中,DOE JGI的Prokaryotic Super Program负责人Nikos Kyrpides和他的研究团队报告了1,003种系统发育上不同的细菌和古细菌参考基因组的发布 - 迄今为止发布的单一最大发表。
“细菌和古细菌是地球上自由生物生物多样性最多的一种,”该论文的高级作者Kyrpides说。“他们已经征服了地球上的每一个环境,因此他们找到了在不同酶和不同生物化学条件下最恶劣条件下生存的方法。”
美国能源部有兴趣更多地了解这种生物多样性,因为微生物在调节地球生物地球化学循环方面发挥着重要作用 - 例如,在地球和海洋环境中管理养分循环的过程。通过基因组测序和分析揭示基因,酶和代谢途径的功能在生物能,生物医学,农业和环境科学领域具有广泛的应用。
新功能,新应用
这项工作是DOE JGI的细菌和古细菌基因组百科全书(GEBA)计划的一部分,该计划旨在对数千种细菌和古细菌基因组进行测序,以填补未开发的生命树枝。“除了鉴定超过50万个新的蛋白质家族外,这项努力还使所有类型基因组序列的系统发育多样性覆盖面增加了一倍以上”,DOE JGI计算生物学家Supratim Mukherjee和该论文的共同第一作者说。 。
由于微生物基因组学研究的很大一部分主要集中在人类病原体或生物技术工作马上,因此GEBA是全球试图通过对多种培养的但表征不佳的微生物菌株进行测序来解决系统发育覆盖知识差距的主要工作。“人们认识到我们没有对生命树的许多部分进行抽样,”美国能源部JGI计算生物学家,该论文的共同第一作者Rekha Seshadri说。“如果我们对树的某些部分进行采样,我们就会发现新的功能,这可能是新应用的重要资源。”
这些基因组的发布是近十年工作价值的结晶,2009年发布了56个GEBA基因组。微生物分离自海水和土壤,植物,牛瘤胃和白蚁肠道等环境。通过社区科学计划在DOE JGI进行基因组测序和分析,通过具有微生物组(IMG / M) 系统的综合微生物基因组公开获得1,003个基因组,所有相关元数据均符合基因组学标准联盟,可通过在基因组在线数据库。事实上,根据DOE JGI的即时数据发布实践,所有这些基因组在测序后立即公开发布,以最大化它们被更大的科学界使用,共同作者,DOE JGI微生物基因组学项目负责人Tanja Woyke表示,谁概述了项目的顺序。
随着1,003个参考基因组中高质量基因组信息的发布,DOE JGI提供了大量新序列,对于对生物技术相关的次级代谢物特征化或研究在特定条件下工作的酶等实验感兴趣的科学家来说,这些序列非常宝贵,Seshadri说。她补充说,由于Kyrpides的研究团队对培养物品系中容易获得的菌株进行了测序,科学家们可以在实验室中对它们进行后续实验。
“与德国莱布尼茨研究所DSMZ和美国ATCC全球生物资源中心等文化收集中心的合作对于完成这项工作至关重要,”Kyrpides说。
虽然很明显,细菌可以启动生物技术的创新 - 例如产生化脓性链球菌的物种,它产生的Cas9蛋白在突破性的CRISPR-Cas9基因编辑工具中起到“剪刀”的作用 - 科学家们才刚刚开始揭示隐藏的潜力存在于细菌和古细菌门的广泛遗传多样性中。
锚定数据的参考框架
加州大学戴维斯分校的微生物学家Jonathan Eisen 在2007年与Kyrpides和Phil Hugenholtz以及莱布尼兹研究所DSMZ的Hans-Peter Klenk一起在美国能源部JGI 开展了GEBA项目,他认为该论文强化了在选择微生物进行测序时,实现系统发育多样性是比随机选择更有用的方法。
他说填写生命之树将为研究人员提供一个参考框架,用以了解他们自己的结果。“这对解释环境数据非常有帮助。例如,如果你去找某处的化石床并找到大量的骨头,但如果以前没有人曾经组装过骷髅,那就没用了,“艾森说。“但是用一个组装的骨架作为参考,”你可以说'这看起来像一个哺乳动物'。宏基因组数据也是如此 - 如果您从[生命]树中获得参考基因组,您可以更准确地锚定环境数据。“
Kyrpides说:“当我们目睹公共数据库被低质量或可疑质量,高度分散和嵌合或污染的基因组输入而被淹没时,来自类型菌株的基因组作为宝贵的分类学标志的重要性不容小觑。”
这项工作的合作者包括德国莱布尼兹研究所DSMZ,佐治亚大学,密歇根州立大学,澳大利亚昆士兰大学和英国纽卡斯尔大学的研究人员。