迄今为止最大的CRISPR作用研究已经开发出一种方法来预测CRISPR-Cas9基因编辑可以引入细胞的确切突变。Wellcome Sanger研究所的研究人员编辑了40,000个不同的DNA片段,分析了数千万个DNA序列,揭示了基因编辑的影响,并开发了结果的机器学习预测工具。这将有助于使用CRISPR-Cas9的研究人员研究疾病机制和药物靶点。
今天在Nature Biotechnology上报道(11月27日),新资源将使科学家能够预测最佳序列,使CRISPR-Cas9基因编辑更可靠,因此更便宜,更有效。
CRISPR-Cas9 *是一种基因编辑技术,使研究人员能够在基因组的任何位置切割DNA,创建突变并关闭特定基因。全世界的科学家都使用这项重要技术来研究哪些基因对从癌症到罕见疾病等各种疾病都很重要。现在,它正在进行治疗性试验,以纠正人类基因中的有害突变。
特异性指导RNA与靶DNA的确切序列结合,引导Cas9'剪刀'在正确的位置切割DNA。然而,很难准确预测最终突变将是什么,因为当细胞修复断裂时,经常发生进一步的变化,重新连接DNA的两个切割末端。
为了研究这一点,研究人员创造了超过40,000对不同的靶DNA和指导RNA,并进行了CRISPR-Cas9基因编辑。通过对不同细胞中每对的深度测序,他们能够详细分析DNA是如何被切割和重新连接的。他们发现修复依赖于DNA的确切序列和指导,并发现它在同一序列中是可重复的。
然后,研究人员使用大量的序列数据来创建机器学习计算工具,该工具创建了确定修复结果的一般规则。该程序 - 称为FORECasT - 使他们能够仅使用靶向DNA序列预测修复的序列。
来自Wellcome Sanger研究所的联合第一作者Luca Crepaldi博士说:“我们迄今已对CRISPR-Cas9作用进行了最大,最全面的研究,并分析了超过一亿个DNA序列,以便我们研究过程。我们证明特定的靶序列以相同的方式被细胞修复,证明细胞机制的作用是可重复的。
来自Wellcome Sanger研究所的联合第一作者Felicity Allen博士说:“在CRISPR-Cas9编辑后发现可重复的DNA修复,结合我们生成的大量序列数据,意味着我们可以使用机器学习创建预测工具我们的资源可以预测CRISPR-Cas9基因编辑产生的确切突变,仅来自靶DNA的序列。它将为未来的CRISPR-Cas9应用节省时间和资源,并且可供所有使用基因的研究人员公开使用编辑研究健康和疾病。“
来自Wellcome Sanger研究所的论文的高级作者Leopold Parts博士说:“CRISPR-Cas9是一种非常重要的系统,用于将DNA突变引入DNA用于研究和前瞻性治疗目的。我们的研究使科学家能够更好地了解其工作原理,我们的转化方法使人们能够预测每个CRISPR-Cas9编辑在细胞中的作用。这样可以更好地设计编辑实验,并可能导致未来的治疗应用。“