从少量材料中鉴定单个植物物种的能力具有惊人的用途,从监测蜜蜂种群到评估食物和营养补充剂的含量,以及制定草食动物早餐的含义。对植物片段进行分类可能很棘手,因此埃默里大学的研究人员开发了一个新的遗传信息数据库,可以与最新的DNA测序技术一起使用,以提高植物鉴定的准确性。
遗传条形码是可变DNA的区域,其可用于通过将其独特的条形码序列与来自数千种植物的已知序列的数据库进行比较来鉴定物种。高通量DNA测序的最新进展意味着现在可以同时区分和分析混合样品中的多个物种。这个过程,DNA元编码,为研究人员节省了在对DNA进行测序之前分离不同植物物种的艰巨任务。在植物科学应用中发表的一篇新论文中,艾默里大学环境科学系的Karen Bell博士及其同事利用公开数据开发了rbcL基因序列库,这是植物中流行的条形码,可供使用在DNA元编码研究中。
Bell的工作建立在植物的第一个DNA元代码编码数据库的基础上,该数据库包含来自72,000多种物种的ITS2条形码序列。通过结合ITS2和rbcL信息,该团队能够从混合的花粉粒样品中准确识别更多物种,从而提高DNA元链接编码技术的分辨率和准确度。
的rbcL基因的基因是有用的,因为条形码其编码的关键酶光合作用的一部分核酮糖二磷酸羧化酶(Rubisco的),因此它在几乎所有的植物种类是存在的。其DNA序列的一部分在物种之间变化很大,使其成为DNA条形码的理想选择。在过去十年中,工厂已开发出几个条形码区域,但rbcL特别适用于新技术。贝尔详细说,“我们之所以选择rbcL是因为基因的长度很容易应用于现代高通量测序方法。” 新的rbcL文库包含来自38,400种植物物种的序列,约占地球上所有种子植物的9%。
高通量DNA测序的快速创新使数据分析方法落后,但rbcL和ITS2数据库的开发意味着DNA元编码可以比以往更快,更准确地用于鉴定植物。使用组合的rbcL和ITS2元代码,Bell和她的团队能够在花粉粒混合物中鉴定出9 种植物中的8 种 - 分别使用rbcL或ITS2条形码进行鉴定。如果物种不包括在参考文库中,则无法通过DNA条形码识别,因此必须添加来自估计的450,000种开花植物的更多序列以使这些数据库更全面。
贝尔和她的同事调整了DNA元编码生物信息学管道,使其能够在数据库开发后使用额外的DNA条形码。这应该进一步提高条形码的准确性,因为贝尔解释说,“现有的遗传标记越多,遗传鉴定的可能性就越大。” 随着基因组测序成本的降低,研究人员不会局限于扫描DNA小片段的条形码:“在未来的某个时刻,我们将使用全植物基因组进行DNA条形码编码。实验室技术是可用,但目前我们没有足够的完整植物基因组来制作数据库。“