Extending machine learning model for implicit solvation to free energy calculations

本文介绍了 Lambda 溶剂化神经网络(LSNN),这是一种基于图神经网络的隐式溶剂模型,其在力和炼金变量导数上进行了联合训练,旨在实现与显式溶剂模拟相当的自由能预测精度,同时为药物发现应用提供显著的计算加速。

原作者: Rishabh Dey, Michael Brocidiacono, Kushal Koirala, Alexander Tropsha, Konstantin I. Popov

发布于 2026-05-05
📖 1 分钟阅读☕ 轻松阅读

原作者: Rishabh Dey, Michael Brocidiacono, Kushal Koirala, Alexander Tropsha, Konstantin I. Popov

原始论文采用 CC BY 4.0 许可(http://creativecommons.org/licenses/by/4.0/)。 这是对下方论文的AI生成解释。它不是由作者撰写或认可的。如需技术准确性,请参阅原始论文。 阅读完整免责声明

想象一下,你正在试图弄清楚一把特定的钥匙(药物分子)与一把特定的锁(蛋白质)的契合程度。为了准确做到这一点,你需要理解这把钥匙在水环境中的行为,因为在人体中,一切事物都浸泡在由水分子构成的海洋里。

本文介绍了一种名为LSNN(Lambda-溶剂化神经网络)的新工具,它帮助科学家比以往的方法更快、更准确地计算这种“水行为”。

以下是关于问题、旧解决方案和新修复方案的简单故事:

问题:“拥挤的房间”与“幽灵”

为了理解药物如何起作用,科学家使用计算机模拟。

  • “金标准”(显式溶剂): 想象一下,试图模拟一把钥匙在一个房间里,而你必须追踪围绕它移动的每一个人(水分子)。你必须计算钥匙如何撞到 A 人,然后是 B 人,接着是 C 人。这极其准确,但就像试图数清海滩上的每一粒沙子一样。它需要巨大的计算能力和时间。
  • “快速”方法(隐式溶剂): 为了节省时间,科学家过去曾假装水不是由个体组成的,而是一种平滑、不可见的雾气。他们使用一个简单的数学公式来猜测雾气如何推动钥匙。这非常快,但这层“雾气”只是一个粗略的猜测。它经常搞错细节,导致关于药物是否有效的预测不准确。

旧的“机器学习”修复方案(以及它为何失败)

最近,科学家尝试使用人工智能(特别是神经网络)来让这层“雾气”变得更聪明。他们通过向 AI 展示水如何推动钥匙(即)来训练它。

  • 缺陷: 这就像只教某人如何转动方向盘来教他们开车,却从不告诉他们速度有多快或使用了多少汽油。AI 学会了向正确的方向推动钥匙,但它无法计算将钥匙从一个地方移动到另一个地方所需的总“努力”(能量)。因此,旧的 AI 模型无法用于比较不同药物的总能量。

新解决方案:LSNN

作者创建了LSNN,这是该 AI 的更智能版本。他们不仅教它如何推动(力),还教它当慢慢“打开”或“关闭”药物与水之间的相互作用时,能量是如何变化的。

类比:
想象你正在试图测量一个背包的重量。

  • 旧 AI: 你能感觉到肩带拉肩膀有多重(力),但你无法判断背包重 10 磅还是 20 磅,因为秤坏了。
  • LSNN: 他们修好了秤。现在,AI 不仅能感觉到拉力,还能通过观察当你慢慢向包里添加或移除物品时拉力如何变化,来计算出确切的总重量。

他们如何测试它

该团队在包含约30 万个小分子的庞大库上训练了这个新 AI。他们将其与“金标准”(缓慢的数沙子方法)和旧的“雾气”方法进行了测试。

结果:

  1. 速度: LSNN 是一名短跑运动员。它计算结果大约只需20 秒。“金标准”耗时近28 分钟(约 1600 秒)。旧的“雾气”方法也很快(约 15–22 秒)。
  2. 准确性:
    • “金标准”最准确(得分为 1 分中的 0.86 分)。
    • LSNN 排名第二,得分为0.73。这比得分低得多(0.48 到 0.63)的旧“雾气”方法有了巨大改进。
    • 本质上,LSNN 达到了“金标准”级别的准确性,但运行速度却达到了“雾气”级别。

那更大的东西呢?(蛋白质)

本文还尝试使用 LSNN 来预测药物如何粘附在大蛋白质上(这是药物发现的终极目标)。

  • 结果: 它显示出希望,但尚未完美。当他们尝试将其用于完整的蛋白质系统时,准确性下降了。作者认为,这是因为 AI 主要是在简单的小分子上训练的,可能会“过度思考”大蛋白质中复杂的相互作用。然而,它仍然显示出清晰、一致的模式,表明它可以得到改进。

底线

本文提出了一种新的“智能雾气”(LSNN),它解决了以前 AI 模型的最大缺陷:无法计算总能量。

  • (像旧的简单数学)。
  • 准确(更接近缓慢、昂贵的模拟)。
  • 它对于比较不同药物是可靠的。

作者得出结论,该工具为药物发现的未来奠定了坚实的基础,使科学家能够以更快的速度筛选数百万种潜在药物,而不会牺牲找到真正疗法所需的准确性。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →