迄今为止,植物功能基因组学领域的许多研究都依赖于基于单一参考基因组的方法。但就其本身而言,单个参考基因组并未捕获物种的完整遗传变异性。泛基因组是在物种个体中发现的所有基因组的非冗余联合,是解锁自然多样性的宝贵资源。然而,产生大量高质量基因组组装所需的计算资源一直是产生植物泛基因组的限制因素。
将植物泛基因组用于对燃料和食品应用很重要的作物将使育种者能够利用自然多样性来改善产量,抗病性和边缘生长条件的耐受性等特性。2017年12月19日在Nature Communications 上发表的一篇论文,由美国能源部(DOE)联合基因组研究所(JGI)的研究人员领导的国际团队,该研究所是劳伦斯伯克利国家实验室(伯克利实验室)的DOE科学用户设施办公室。 ,使用Brachypodium distachyon测量植物泛基因组的大小,Brachypodium distachyon是一种广泛用作谷物和生物量作物模型的野生草。作为JGI的植物旗舰基因组之一,B. distachyon 是最完整的植物参考基因组之一。
JGI 植物功能基因组学小组负责人John Vogel补充说:“有大量基因未在单个参考基因组中捕获。” “事实上,泛基因组中约有一半的基因存在于不同数量的细胞系中。”为了准确估计植物泛基因组大小的主要目标,沃格尔和他的同事从头开始全基因组研究。汇集和注释54种地理上不同的B. distachyon品系,产生的泛基因组含有几乎两倍于任何单独品系的基因数量。
优先保留基因
“一个物种的基因组是一组基因组,每个都有自己独特的转折,”JGI生物信息学家和研究第一作者肖恩戈登补充道。“现在知道专注于单个参考基因组会导致对遗传多样性的不完整和有偏见的估计,并忽略对育种应用可能具有重要意义的基因,我们应该在未来的自然多样性研究中更好地纳入多个参考文献。”
此外,仅在一些品系中发现的基因倾向于促成在某些环境条件下可能有益的生物过程(例如,抗病性,发育),而在每个品系中发现的基因通常支持必需的细胞过程(例如,糖酵解,铁转运)。 。
“这意味着如果可变基因在某些条件下有益,则优先保留它们。这些正是育种者需要改良作物的基因类型。“沃格尔说。
此外,仅在一部分细胞系中发现的基因表现出更快的进化速率,更接近转座因子(被认为在泛基因组进化中起关键作用),并且不太可能在功能上与染色体位置相同。其他草中的等同基因。