AI发现自闭症-导致“垃圾”DNA中的突变

放大字体  缩小字体 发布日期:2019-05-29 浏览次数:84

普林斯顿大学领导的团队使用基于人工智能(AI)的技术表明,通常被称为“垃圾”DNA的突变可能导致自闭症。Nature Genetics报道的研究结果首次将调节DNA中的突变与自闭症等复杂疾病联系起来,并表明这些改变会影响大脑中基因的表达,包括那些负责神经元迁移和发育的基因。

AI发现自闭症-导致“垃圾”DNA中的突变

研究人员表示,该方法还可以更广泛地用于研究非编码突变在癌症或心脏病等疾病中的作用。普林斯顿大学计算机科学和基因组学教授Olga Troyanskaya博士评论说:“这是第一次明确证明非遗传性非编码突变导致任何复杂的人类疾病或病症。”“这种方法为任何疾病的分析提供了一个框架。”Troyanskaya是该团队发表的报告的高级作者,该报告的标题是“全基因组深度学习分析确定非编码突变对自闭症风险的贡献”。

作者评论说,在了解自闭症谱系障碍(ASD)的遗传学方面取得了很大进展,但研究表明,蛋白质编码基因的突变仅占自闭症自发病例的约30%,其中没有已知的家族史。事实上,只有大约1-2%的人类基因组包含编码蛋白质的基因。其余98-99%的基因组是非编码DNA,历史上称为“垃圾”DNA,但我们现在知道它包含在控制基因表达位置和时间方面发挥重要作用的调控区域。

作者继续说,虽然ASD中非编码突变的潜在作用已被“长期推测”,但仍无法筛选整个基因组以识别调节DNA的变化并预测这些变化如何导致ASD或其他复合物。疾病。任何一个人都可能有几十个非编码突变,其中许多突变是他们独有的,并且识别具有相同疾病的个体中的常见突变是不可能的。“非编码突变对ASD的贡献分析具有挑战性,因为很难评估哪些非编码突变是功能性的,其中有哪些是导致疾病表型的,”作者说。

以前的分析方法发现,与未受影响的人相比,检测自闭症患者的调节突变数量存在差异是很困难的。从历史上看,实现这种洞察力的唯一方法是通过一种实验方法,包括测试每种突变对抗超过2,000种蛋白质 - 蛋白质相互作用,以及跨细胞类型和组织,这将达到数亿次实验。甚至更近期的机器学习方法也只能查看基因组的目标部分。

采用不同的方法,Troyanskaya等人训练机器学习模型来预测一段非编码DNA的变异如何影响基因表达。他们将该模型应用于Simons Simplex Collection,这是一个自闭症人群,包括近2,000个家庭“四重奏”的全基因组,包括患有自闭症的孩子,未受影响的兄弟姐妹以及他们未受影响的父母。在每个家庭中都没有先前的自闭症史,因此受影响儿童的任何突变都必须自发产生,并且很可能在这种疾病中发挥作用。

“Simons Simplex Collection的设计使我们能够进行这项研究,”研究共同作者,在Flatiron Institute的计算生物学中心(CCB)的Jian Zhou博士说。“未受影响的兄弟姐妹是一个内置控件。”Simons Simplex Collection由Simons Institute维护,Simons Institute是Flatiron Institute的母公司。Troyanskaya也是Flatiron Institute的CCB的基因组学副主任。

该团队将计算机算法应用于该集合中1,790个四重奏的数据。该系统能够了解基因组中的模式,并自学如何识别DNA的生物学相关部分,并预测非编码区域的变化是否可能在影响基因调控的2,000多种蛋白质相互作用中发挥作用。该算法实际上“沿着基因组滑动”,在其周围的1,000个碱基对的背景下分析每个碱基对,并扫描所有突变。然后,计算工具可以预测基因组中任何突变的影响,并提出可能调节基因的DNA序列的优先列表,以及可能影响该调控的突变。

“我们的论文真正允许你做的是采取所有这些可能性并对它们进行排名,”Christopher Park博士评论说,他目前是Lewis-Sigler综合基因组学研究所的访问科学家,以及Flatiron研究所的研究员。“优先排序本身非常有用,因为现在你也可以继续在最优先的情况下进行实验。”计算系统最终生成一个“疾病影响评分”,作为估计变异的可能性的估计。对疾病的影响。

“这是我们通过这种分析引入遗传研究的转变,”Troyanskaya实验室研究科学家Chandra Theesfeld博士指出。“除了研究大群个体共有基因突变的科学家之外,我们在这里应用了一套智能,复杂的工具,告诉我们任何特定的突变将会发生什么,甚至是那些罕见或以前从未观察到的突变。”

有趣的是,结果表明,非编码区域的突变影响了类似的基因和功能,这些基因和功能与先前通过研究聚焦编码基因的自闭症有关。“值得注意的是,我们的研究揭示了与ASD相关的遗传性调节异常中的重要生物学趋同,”作者写道。“我们对突变的影响对DNA和RNA影响的分析指向了相似的受影响基因和途径,表明调控突变的影响是收敛的。此外,我们在ASD先证者中发现的高影响非编码区域影响先前发现受ASD中的L​​oF [功能丧失]编码突变影响的相同基因...这种趋同为非编码调节突变对ASD病因学的因果贡献提供支持。 ”

“这与自闭症最有可能在大脑中的表现一致,”帕克说。“这不仅仅是发生突变的数量,而是发生了什么样的突变。”Troyanskaya补充说,“现在,98%的基因组通常被扔掉了。我们的工作可以让你思考98%我们能做些什么。“

“如果发现本网站发布的资讯影响到您的版权,可以联系本站!同时欢迎来本站投稿!

0条 [查看全部]  相关评论