基因中仅一个碱基对的差异可以改变编码蛋白质的结构,并以可以从无害到引起致命疾病的方式影响生物体。预测单个碱基对替代物如何影响生物体是一项具有挑战性的任务。在生物信息学出现的一篇论文中,研究人员将机器学习与遗传算法相结合,以克服现有方法的局限性。
该团队,包括沙特阿拉伯阿卜杜拉国王科技大学的Trisevgeni Rapakoulia,采用了一种方法,将几种分类模型的输出结合起来,并开发了一种新的遗传算法,将每个单独的分类器演化为最佳性能。
Rapakoulia说:“我们的方法使用新的适应度函数来平衡灵敏度和特异性权衡,同时降低了提取的预测模型的复杂性并改善了它们的泛化特性。”
结果,新算法比现有方法更成功地表征遗传变异。它还会产生一个分数,可以预测变异影响的严重程度。研究小组强调,预测因子与单碱基对替代的严重性之间的关系应通过进一步测试更大的数据集来正确确认。