小白鼠们的福音?AI有望取代动物实验判断化学品毒性


小白鼠们的福音?AI有望取代动物实验判断化学品毒性



据国外媒体报道 , 日前巴尔的摩约翰霍普金斯大学研究人员利用机器学习技术开发了一种判断化学物质毒性的新方法 , 有望替代残酷的动物实验 。
人类可能接触到的化学物质数量惊人 。 单单欧洲化学品管理局(ECHA)认可的就有超过130,000种化学分子 。 其美国同行认可的是85,000种 。 测试所有这些化学物质的毒性几乎是不现实的 。 特别是在动物身上进行试验依然存在争议 , 过程缓慢且昂贵 , 通常也是残酷的 。 事实上 , 这种动物实验方式并不可靠 , 其结果通常是不可复制的 。
如果在动物实验之前 , 有某种方法可以预测某种物质可能产生的毒性 , 那么总体情况就会变得更好 。 这将使风险最高的人能够被优先考虑 。 为此 , 巴尔的摩约翰霍普金斯大学(Johns Hopkins University)的托马斯?哈通(Thomas Hartung)等毒理学家多年来一直在努力寻找化学物质分子结构与其生物活性之间的客观联系 。 现在 , 哈通博士认为他已经找到了两者之间的一种联系 。 就像当今的许多技术进步一样 , 这种研究发现依赖于机器学习技术 。
这是一种将分子结构和生物活性联系起来的方法 。 它被称为“解读” , 并试图通过与具有类似结构的测试化学品的对比来推断未经测试的化学物质对生物体的危害 。 2015年 , 业内表示“解读”如果满足ECHA化学品注册 , 评估 , 授权和限制(REACH)要求 , 可以作为动物测试的替代方案 。 但是 , “解读”取决于专家分析和意见 , 这使其具有主观性 , 并且难以超越那些经过充分研究的小部分化学物质 。
哈通博士认为 , 机器学习具有在大量数据中发现模式的能力 , 可以帮助缩小这一差距 。 他在这项工作中的得力助手是计算机科学家托马斯?卢埃特菲尔德(Thomas Luechtefeld) 。 为了利用机器学习的能力 , 他们两人首先需要大量的优质数据 。 当卢埃特菲尔德刚刚开始工作时 , 这些都是不可用的 。 哈通手头只有大约250种化学物质的详细数据 。 然而 , 在2014年 , 他开始建立一个数据库 , 通过下载9801种在REACH上注册的化合物的816048项毒性研究 , 从而克服了这一限制 。
卢埃特菲尔德花了一年时间训练算法来阅读这些研究 , 处理它们包含的文本并提取相关信息 。 该算法自动将化学特征(例如特定原子群的存在)与危害度量(例如动物试验中的致死剂量中值)相关联 , 从而比较数据库中的所有化学物质 。 两位研究人员在2016年报告的结果确实为不同类型毒性的流行提供了一些见解 。 但是为了做出更据普遍性的预测 , 他们仍然需要更大的数据集 。
因此 , 卢埃特菲尔德在过去一年里一直在搜集公共数据集 , 例如由美国国立卫生研究院运营的PubChem数据集 。 他现在掌握了80,908种化学品的相关数据 , 并能够将其特征与74种危害相关联 。 这些不仅仅是医学上的生物危害 , 它们还包括火灾危险和破坏臭氧层的可能性等等 。
他最新的算法集中在九种毒性 , 包括皮肤刺激 , 眼睛刺激和引起突变的潜力 , 这些通常通过动物试验评估 。 通过使用来自测试物质的数据 , 这些算法能够估计未经测试的化学物质毒性 。 这种毒性分析结果并不是诸如动物试验中致死剂量中值那种具体数字 , 而是提供了一种物质危害程度足以让人担心的概率 。 任何分值高于0.8的化学物质都应该被视为一个问题而不再赘述 。 低于0.2的化学物质都可以被认为是安全的 。 研究人员应当谨慎对待这些值之间的化学物质评分 , 直到有更多的数据来推动他们的分数上升或下降 。

推荐阅读