2014年,我开始了我的博士工作在实验室的艾伦Saghatelian在索尔克研究所在美国加利福尼亚州拉霍亚,这有在我们的细胞微小的蛋白质长期被忽视的研究人员在获得牵引力的想法。研究人员最近认识到,基因组包含的基因非常小,以至于传统的基因组注释方法已经错过了这些基因,并且有针对性地搜索DNA的蛋白质编码片段表明可能有数千种所谓的微蛋白在我们的细胞。
在我加入实验室之前,Saghatelian的小组开发了一种新的方法来验证在多种人类细胞系和组织中存在约400种微蛋白。其他实验室同样证实了这些预测肽的存在,指出了微蛋白的普遍存在。但是他们在做什么?
微生物蛋白在生物学背景下的功能很快成为该领域的焦点。一些研究人员,包括Saghatelian的研究小组,通过寻找与感兴趣的微蛋白相互作用的蛋白质来研究这个研究问题。在我开始实验的同一年,该小组发表了关于微蛋白MRI-2的工作,后来更名为CYREN,它似乎可以调节DNA修复。它是仅有的少数几种微蛋白之一,但许多研究估计还有数百或数千种微蛋白需要研究。该领域的范围很广。我知道我想进入这个新兴的研究领域。
基于基因组数据,预计数千种微蛋白存在于物种间。
微蛋白不是细胞唯一的微小蛋白质,但类似的微小肽激素,如胰岛素,只有在从较大的前体蛋白切割后才具有生物活性。另一方面,微蛋白就是这样开始的。它们从一个小型开放阅读框(smORF)直接翻译成它们的活动形式。事实上,这些smORF是如此微小,以至于研究人员在21世纪初开始预测新测序的人类基因组中的所有蛋白质编码区域时忽略了它们。他们使用100个密码子的最小长度截止值来进行基因分配,以降低假阳性率。但在过去的十年中,基因组学和蛋白质组学方法的发展已经揭示了数百到数千个smORF。
确定它们编码的微蛋白的功能一直是具有挑战性的。首先,新发现的编码蛋白质的smORF在克隆并在培养的人类细胞中表达时通常不能产生可检测量的蛋白质,可能是因为它们的大小使得微小的蛋白质不稳定。此外,这些新型微蛋白中的大多数与任何生物体中的任何已知蛋白质不同源,使得开发和检验关于其功能的假设极其困难。
尽管存在这些挑战,但研究人员在表征已在遗传密码中发现的推定微蛋白的功能方面正在取得进展。用于鉴定蛋白质 - 微蛋白相互作用的新技术揭示了微小分子如何在较大的蛋白质复合物的情况下起作用,以及这些复合物倾向于在细胞中发现的情况。在过去五年中,我们小组和其他人已经发现了微蛋白在发育,代谢,肌肉功能,DNA修复和线粒体活动中的合理作用,有些甚至可能与疾病有关。我们才刚刚开始划清这个领域的表面。已经在人细胞系和组织中检测到数百种微蛋白,并且基于基因组数据预测数千种微蛋白存在于物种之间。
微蛋白的发现
一旦明确基因组含有少于100个密码子的蛋白质编码区,科学家们就会重新思考并发明了发现smORF及其编码的微蛋白的技术。在果蝇的2011年信息学分析中,使用两种蝇类的保护和蛋白质编码潜力作为参数,苏塞克斯大学的Juan Pablo Couso及其同事预测了大约400到4,500个真正的smORF。
几年后,该领域采用核糖体分析技术来鉴定“核糖体足迹” - 与核糖体相关的mRNA,可能是在翻译行为中。2014年,耶鲁大学的Ariel Bazzini及其同事利用这种方法在斑马鱼和人类基因组中发现了190个积极翻译的smORF。此外,他们在注释基因的上游5'非翻译区(UTR)和下游3'UTR中鉴定出311个smORF。同年,Saghatelian小组 - 然后在哈佛大学,但很快转移到Salk,在那里我加入了它 - 在所有阅读框中搜索了所有可能的翻译产品的定制RNA-seq数据库的蛋白质组学数据,并发现了237个微蛋白多种人细胞系和组织。
这些技术已经在不同类型的所谓非编码RNA中鉴定出smORF的证据,包括前mRNA的内含子,长的非编码RNA,以及microRNA和核糖体RNA的初级转录物。下一步是确定它们编码的微蛋白并理解它们的生物学重要性。
微蛋白功能
通过鉴定微蛋白中的结构域或基序,这些结构域或基序也出现在较大的,特征良好的蛋白质中,研究人员可以开始收集功能的线索。测量不同细胞类型或环境中转录物的差异表达的遗传筛选也可指向可能的生物学作用。最直接的是,研究人员可以对感兴趣的微蛋白进行遗传标记,在人体细胞中表达,并观察它在细胞内的定位位置以及它与之相互作用的其他蛋白质。
传统方法,如标记蛋白免疫沉淀,可用于揭示微蛋白 - 蛋白质相互作用。在一种常用的测定中,例如,将编码称为FLAG的短肽的DNA序列添加到编码目的微蛋白的基因中,并在培养的人细胞中表达。
然后收获细胞并裂解,并使用体外结合珠子的FLAG靶向抗体富集标记的微蛋白。当珠子和附着的微蛋白被免疫沉淀时,相互作用的蛋白质配偶体会一起出现。一旦从样品中分离,可以使用蛋白质组学技术(例如质谱法)和生物化学方法(例如蛋白质印迹)鉴定相互作用的蛋白质。
白质复合物相互作用而在细胞内起作用。例如,使用FLAG方法,Saghatelian的研究小组发现CYREN与细胞核中的异二聚体蛋白复合物相互作用,与DNA双链断裂的松散末端结合,这表明CYREN在DNA修复中起作用。之后,Jan Karlseder小组在Salk进行的功能研究表明,CYREN在细胞周期的某些阶段抑制非同源末端连接修复途径。(见插图。)
但是像FLAG这样的方法是非特异性的;除了与感兴趣的微蛋白真正相互作用的蛋白质外,免疫沉淀物还含有许多管家蛋白质。研究人员可以尝试不同的缓冲条件和其他参数来减少污染蛋白质,但这会导致失去目标蛋白质与较弱键相互作用的风险。
在我加入Saghatelian实验室后不久,我开始着手解决这个问题。2015年,我开始使用称为抗坏血酸过氧化物酶2(APEX2)的蛋白质标签,该标签由Alice Ting的小组开发用于蛋白质组学定位,然后在麻省理工学院开发。当APEX2标记的蛋白质暴露于生物素苯酚和培养细胞中的催化剂时,附近的蛋白质用生物素标记。因为活性生物素苯氧基的半衰期小于1毫秒,标记半径限制在20纳米,这意味着只有紧邻APEX标记分子的蛋白质才能获得生物素标记。然后裂解细胞,并使用链霉抗生物素蛋白珠子富集生物素化的蛋白质,并通过蛋白质组学和生物化学方法鉴定。
我和我的同事应用APEX2邻近标记方法来鉴定人细胞中表达的微蛋白的相互作用伙伴。我们靶向的微蛋白之一是线粒体延伸因子1微蛋白(MIEF1-MP),其已在早期研究中报道以调节线粒体动力学。我们的实验揭示了MIEF1-MP与线粒体核糖体(mitoribosome)的相互作用,并且人类mitoribosome的另外的低温电子显微镜研究表明Mitor1-MP可能是mitoribosome组装所必需的。实际上,当我们测量线粒体中蛋白质合成的速率时,我们发现MIEF1-MP的丢失降低了翻译速率。另一方面,提高的MIEF1-MP水平导致翻译增加。
这些微蛋白 - 蛋白质相互作用检测技术的开发和应用提供了微蛋白功能的线索。早期的研究暗示了一个多样化的功能库,应该促使科学家们思考如何利用这些微小的蛋白质。
微蛋白在工作
想到的一个应用是生物医学。微蛋白已经被用于各种细胞和生理功能,生物过程,如果出现问题,可能会导致疾病。例如,DNA修复缺陷是癌症中的常见主题,而
线粒体蛋白质合成中的问题是代谢和发育障碍的主要原因。
诺华公司的一个研究小组与我们小组合作开展了其他微蛋白项目,他们发表了一项名为Minion(微蛋白融合剂)的微蛋白研究,该研究可能有一天会被用于靶向给药。Srihari和Srinath Sampath的小组在受伤后发现了再生小鼠肌肉中的微蛋白。损伤后三至四天,Minion的产生峰值,类似于已知控制肌细胞融合的称为Myomaker的蛋白质的表达谱。
后来,功能研究表明,Minion与Myomaker一起使细胞融合并形成能够收缩的多核纤维。缺乏Minion会导致骨骼肌,包括膈肌,导致小鼠围产期死亡。对Minion-Myomaker
系统的深入了解促使研究人员设想利用它来靶向癌症或其他环境中的融合细胞。
早期的研究暗示了一个多样化的功能曲目。
另一种新发现的与疾病有关的微蛋白是CASIMO1(癌症相关的小整合膜开放阅读框1),一种83-氨基酸的微蛋白,其特征在于海德堡德国癌症研究中心的Sven Diederichs小组。在用于鉴定涉及激素受体阳性原发性乳腺癌样品的人基因的表达谱分析研究中,最初注释为推定的非编码RNA的RNA转录物在乳腺肿瘤中显示出比正常组织高六倍的水平。
研究人员后来发现,CASIMO1的丢失破坏了肌动蛋白细胞骨架的调节,迁移能力受损,细胞增殖率降低,并使G0 / G1期的细胞周期停滞不前 - 预计会限制癌细胞生长。微蛋白似乎也调节细胞脂质水平和信号转导。
这些发现强调了进一步研究的重要性,以发现和表征新的smORF及其编码的微蛋白。生物化学研究表明,微蛋白使用仅仅2-4个氨基酸的短序列与较大的蛋白质复合物相互作用以调节生物学。这种相互作用适合于小分子抑制,因此,微蛋白 - 蛋白质相互作用可以揭示新的可药物靶标。随着研究人员继续探索微蛋白的功能,以更好地了解它们在这些不同作用和疾病状况下的作用机制,它将使新疗法的开发成为可能。