改善生物燃料生产,科学家们必须了解的基本相互作用导致的表达植物和微生物的关键特征。要理解这些交互,科学家们利用不同层次的信息(关于基因之间的关系,基因和表型之间)结合新的计算方法,将大量的数据建模框架。研究人员现在可以确定目标控制重要性状的基因生物燃料和bioproduct生产。这项工作中所使用的算法已被用于打破超级计算exascale障碍首次在世界任何地方。
这种方法允许科学家分析大规模数据集。他们可以使用exascale计算机,计算机每秒执行1018年的计算。通过这种方法,科学家可以了解细胞是如何工作的。他们可以使用生物有益的见解特征为植物和微生物。能够使用exascale计算机开辟了可能性研究高度复杂和相互关联的分子过程之前不可能在细胞水平的细节。这样的计算系统生物学也预示着一个新时代。
生物组织是一个复杂的系统相互作用的分子和大分子组成的功能网络。复杂的特征(表型)在生物体是精心策划的结果,分层、异构表达基因的集合。然而,这些基因和基因变异的影响是具有历史意义的选择压力的结果和当前环境和表观遗传信号,因此,他们同现可以以不同的方式被视为全基因组相关性。生物质固执(即植物的抗降解或解构,最终使进入植物的糖用于生物能源)是一个复杂的多基因性状高度重视生物燃料的计划。
为了更好地理解所涉及的分子相互作用和识别抵制目标基因参与木质素生物合成/退化,本研究使用的数据来源于re-sequenced基因组从超过800个不同杨树trichocarpa基因型结合代谢组学数据(代谢物的浓度)和pyrolysis-molecular束质谱数据。此外,科学家们使用其他形式的基因调控包括co-expression co-methylation,联合进化网络。
在分析这些数据,一个团队开发了一个“证据”(卫矛)评分系统整合不同层次中的信息和量化卫矛基因与目标函数的数量。他们这个新评分系统用于量化卫矛基因与lignin-related基因和表型跨网络层。评分系统允许申请新假说的生成新的候选基因在p . trichocarpa木质素生物合成,包括各种AGAMOUS-LIKE基因(转录因子的一种控制其他基因的表达)。由此产生的全基因组研究协会网络被证明是一个强大的方法来确定多效性的影响多个表型(基因)和上位(多个基因共同影响一个底层细胞功能和表型)关系,因此,复杂表型的分子基础,如不听话。
彗星的算法软件,创建联合进化网络在这项研究中,使用超级计算机已经被移植到新的峰会,目前世界上最快的和最聪明的超级计算机在橡树岭领导计算设备。研究小组使用彗星软件打破exascale障碍,达到一个峰值吞吐量1.88 exaops-faster比之前报道的科学应用程序分析基因组峰会的超级计算机上的数据。研究小组完成了壮举,相当于每秒执行近200亿亿计算,通过使用一个混合的数值精度新NVIDIA图形处理单元计算机芯片技术称为张量的核心。在这种情况下,研究人员实现一种新的方法,利用张量芯性能得到大幅增加。