对于土壤微生物学来说,这是最好的时期。虽然没有人进行过准确的人口普查,但一勺土壤中仍有数千亿的微生物细胞,包括数千种物种。“它是地球上最多样化的微生物栖息地之一,但我们对居住在土壤中的微生物的身份和功能知之甚少,”密歇根州立大学微生物生态中心杰出教授Jim Tiedje说。Tiedje,以及美国能源部联合基因组研究所(DOE JGI)和劳伦斯伯克利国家实验室(伯克利实验室)的密歇根州立大学同事和合作者,发表了迄今为止2014年3月10日发布的最大的土壤DNA测序工作。 美国国家科学院院刊 (PNAS)。在这项项目的第一项研究中出现的是一个简单,优雅的解决方案,用于筛选收集到的大量信息,以及对这些环境的挑战有多严峻的现实检查。
“大草原代表了世界上最肥沃的土壤中最大的土地,这使其成为参考场所和了解其微生物群落的生物基础和生态系统服务的重要因素,”Tiedje说。“它隔离了美国任何土壤系统中碳含量最高的碳,每年生产大量生物质,这对生物燃料,粮食安全和碳封存至关重要。它是一个生态系统,与世界初级生产力和生物地球化学循环中的大型海洋环流相似。“
自十多年前第一个人类基因组发布以来,DNA测序的应用已被扩展为一种强大的诊断技术,用于衡量地球多样化生态位的健康状况及其对变化的反应。在美国能源部JGI发起的这项雄心勃勃的试点研究中,密歇根州立大学的研究人员试图比较从中西部玉米田采集的不同土壤的微生物种群,这些土壤在连续栽培100年,与来自大草原原始大片的土壤相比。理论基础与人类基因组计划的基本动机同样令人信服。
Great Prairie土壤项目也是一种非常适合DOE JGI的强制性计划,它提供了实际的原始排序能力。除了产生足够数据所需的吞吐量之外,使土壤成为生物学“重大挑战”的一个关键因素是,很少有参考基因组,“Rosetta Stones”,以帮助筛选这些可能为重要特征提供信息的小块数据如农业生产力,碳循环,营养加工或疾病和抗旱性。另一个原因是大量原始数据所需的分析规模。对于Great Prairie土壤实验,该团队产生了近4000亿个代码,相当于130多个人类基因组当量,或88,000个 大肠杆菌 基因组。
该研究的主要作者,密歇根州立大学的C. Titus Brown说,“这就像粉碎了整个图书馆的内容,并重新组装了大量碎片中的单个卷。”他将这种类比用于传统的“霰弹枪”环境样品的DNA测序工作。布朗喜欢用查尔斯狄更斯的“双城记”作为解释技术的特别书(......这是智慧的时代,是愚蠢的时代......)。
草原样本上使用的分析方法首先在最近特征的数据集中进行了尝试,该数据集来自人类肠道微生物组的研究 - 生活在我们体内的微生物群落。布朗和他的同事,第一作者Adina Chuang Howe,部署了一种压缩方法,与通过互联网传输的JPEG图像等大型计算机文件相同,可以丢弃大量数据而不会降低实际数据内容。布朗称这种技术为“数字规范化”。
在肠道数据集上测试后,他们将其应用于土壤集。“这些结果仍然让我感到震惊,”布朗说。“这给我们带来的是实际生物分析的计算要求降低了2到200倍。”
布朗说,关键点在于,除了使分析更容易和不可能的分析 - 土壤宏基因组,特别是平易近人之外,该过程显着改善了困难生物的基因组装配,并使转录组装配(编码蛋白质的RNA分子)由基因组表达的琐碎的。此外,它还提供数据管理“民主化”,使无法访问云计算和高性能计算的科学家能够对其进行分析。
“我认为这可能导致思维方式的根本转变,”布朗说。“我们实际上正在将生物序列分析中的标准重量级方法转换为超高效的流式方法。”因此,研究人员可以投入更多资源从噪声中提取科学,因为他们的基本分析支出已经下降。
至于土壤的实际生物学,分析仍在进行中。但与此同时,使用这种简单优雅策略的含义比比皆是。
来自伯克利实验室地球科学部的高级科学家Janet Jansson以及DOE JGI的Metagenome计划负责人Susannah Tringe在DOE的使命中为该项目提供了支持。
“我们的目标是提高将遗传信息与生态功能联系起来的能力,以及为改善土壤管理,碳固存,生态系统服务和生产力提供诊断工具的潜力,”Jansson说,他曾前往偏远地区。北极地区对永久冻土融化的微生物群落进行采样。
“宏基因组序列分析提供了更好地了解土壤群落功能的手段,以及不同土壤生态系统中组成,多样性和功能的差异和相似性。”
她说,数字标准化应该能够显着改善基因组装配,并为未来对土壤和其他复杂环境的研究提供重要参考。
“这将有助于我们建立基因和生物如何在土壤中进化的模式,以及如何利用这些模式来理解和潜在地管理适应性特征,如温室气体通量,碳稳定性和植物病害发展,”Jansson说。“我们现在所知道的是,土壤微生物负责循环营养,这对所有更高级别的生命至关重要。土壤微生物在碳循环中的作用是最近突出的一个例子,因为微生物介导的碳吸收和隔离的重要性以及有机物降解和二氧化碳和甲烷释放到大气中的相反过程。这些过程之间的相对平衡对大气碳预算和随后的全球变暖趋势产生了巨大影响。“
PNAS研究的底线是,尽管有4000亿个基础数据,但仍然不足以深入地询问局部土壤样品中的微生物参与者,这证实需要更多的数据来全面研究土壤宏基因组的含量。
或者,用另一个查尔斯狄更斯的角色来解释,布朗说,“请先生,我们还能有更多......数据。”
除了美国能源部科学办公室提供的支持外,该研究得到了美国农业部,国家食品和农业研究所,国家科学基金会和大湖生物能源研究中心的支持。