人类基因组包含估计20,000个编码蛋白质的基因。蛋白质是身体的“工作者”,其任务是执行对生存至关重要的特定功能。尽管它们很重要,但是有一种非常小的蛋白质,少于100个氨基酸,对于理解生物是如何工作以及哪些研究人员知之甚少至关重要,因为仅仅识别它们是一个真正的技术挑战。
然而,现在,由生物系统设计组负责人ICREA研究教授Luis Serrano领导的巴塞罗那基因组调控中心(CRG)的研究人员已开发出一种技术,可以根据新的技术对这些蛋白质进行预测和分类。生物信息学工具,他们提供多元数据。这使他们发现这些小蛋白质占细菌基因组的至少16%。他们的研究成果发表在Molecular Systems Biology期刊上。
“我们对肺炎支原体细菌进行了研究,结果发现,我们可以忽略其减少的基因组中编码的每100种蛋白质中的10种,因为它们非常小,”CRG的工作人员科学家MaríaLluch-Senar说道。研究的主要研究者。“在更复杂或人类生物的情况下,这个百分比可能非常重要,”她补充道。
最近的研究揭示了这些小蛋白质的重要性,例如昆虫,动物,植物甚至人类分泌的抗菌肽对感染的反应。这些小蛋白质也被证明可以与环境中的其他细菌以及宿主(如我们的生物体)进行交流。事实上,它们可能在平衡微生物群中发挥着非常重要的作用。
“我们研究的兴趣在于确定这些迄今为止被忽视的蛋白质可以呈现的功能的数量和种类,”Samuel Miravet-Verde博士解释说。CRG的学生和工作的主要作者。
以前,当基因组被注释时,研究人员只能解释在转录和翻译后可以产生超过100 个氨基酸的蛋白质的DNA片段。由于涉及技术挑战,低于此数量的任何东西都被忽视,因为用于鉴定蛋白质的常用方法是不可能的,因为它们非常小。由于这些蛋白质具有非常短的寿命,它们不丰富,或者它们呈现组织和时间特异性表达模式使得它们更难以检测,因此这进一步复杂化。
此外,通常进行比较保守性研究,以便能够为蛋白质分配功能,其中采集不同的生物体并尝试确定它们的存在程度,比较它们的长度并确定它们之间的相似性。它们是或不重要。由于无法识别这些小蛋白质,因此不能采用这种方法对生物进行比较,因此它们的作用仍然是个谜。
在这项研究中,研究人员对109种细菌基因组进行了初步研究,他们试图对这些蛋白质进行分类或分配。为此,他们应用已经在其他设置中使用的算法,他们输入与蛋白质性质相关的参数。他们随后通过使用已在其他细菌物种中鉴定的蛋白质验证了他们的发现。
他们开发的技术是通用的,可以应用于不同的细菌物种。