这里是在消费类产品超过10种万种化学物质。对绝大多数人而言,关于其毒性的信息非常少。传统上,研究人员将测试对动物感兴趣的化学物质。作为一个极端的例子,农药经历了大约30次动物试验,耗资约2000万美元,并且在五年内消耗了10,000多只老鼠,大鼠,兔子和狗。该测试需要大约20千克的化学品;获得这样的量对于尚未上市的物质来说可能是一个很大的挑战。其他物质受到较少的审查,但即使是监管标准较低的产品,如工业化学品,在进入市场之前也需要价值500万美元的动物试验。
我们的团队,约翰霍普金斯大学动物测试替代中心(CAAT)寻求更好的方法。正如许多生物学家最近所做的那样,我们转向智能计算机程序寻求帮助。我们发现人工智能(AI)可以挖掘现有的化学毒性数据并生成新信息。2016年,我们根据欧洲REACH法规对工业化学品注册的10,000多种化学品编制了800,000份毒理学研究数据库,并用它来提供先进的预测算法,使我们能够预测任何化学品的毒性而不涉及到动物实验室。
该软件利用大数据和转移学习的强大功能,这是一种机器学习方法,可将信息从一个任务或一组项目应用到另一个任务。类似化学品具有相似的性质基于该原理,该软件构建了化学世界的地图。类似的化学物质彼此接近,不同的化学物质更远。然后,该模型可以在地图上放置新化学品,评估他们对邻居的了解,并从该信息中猜测他们可能对健康和环境造成的潜在危害。将更多数据输入模型,它变得越强大。
该数据库与全球安全咨询和认证公司Underwriters Laboratories(UL)合作,已扩展到超过1000万个化学结构,其中超过30万个用生物和化学物理数据注释,其中约50,000个还包括动物数据。 。使用亚马逊云服务器,花了两天时间分析1000万种化学品之间的相似点和不同点,将它们放在地图上。根据动物试验将此应用于190,000种分类化学品,计算机正确地预测了87%的毒性研究结果 - 超过70%的动物试验在重复动物试验中再次发现有毒物质的可能性。目前由该模型分析的九种不同危险分类的传统测试消耗了欧洲安全测试中所有动物的57%,或每年约600,000只动物。这些包括诸如皮肤和眼睛刺激/腐蚀,皮肤过敏,急性毒性和致突变性的测定。
数据库中的一些化学品已经过度测试,造成不必要的动物死亡。例如,在兔眼中测试了两种化学物质超过90次;在同一眼试验中,69种物质的测试超过45次。我们的AI方法可以大大减少对这些常见动物毒性测试的需求,并在此过程中节省相当多的资金。运行超级计算机来创建地图成本大约为5,000美元,每个预测的计算机成本现在可以忽略不计。最重要的是,除了化学品进入市场的规定之外,化学家可以在化合物合成之前识别危害。当需要更换有毒化学品时,AI方法可以帮助确保选择毒性较小的物质。
这种方法的力量取决于数据的可用性,其实施仅适用于直接依赖于化学结构的有毒性质。如果潜在的生物学是复杂的 - 例如物质与癌症之间的联系,或对发育中的胚胎的侮辱 - 需要更多的信息。
在这里,大型标准化数据库很少见,但美国某些机构的机器人测试程序除外。这些程序已经对超过700种细胞分析进行了大约2,000种化学物质处理,并且将近10,000种化学物质进随着计算能力现在更容易获得并且更加经济实惠,AI可以解决许多现实问题,例如限制动物在安全测试和生物研究中的需求。