A Massively Scalable Ligand-Protein Dissociation Dynamic Database Derived from Atomistic Molecular Modelling

本文介绍了 DD-03B 数据库,该库基于原子级分子模拟生成了 19,037 个配体 - 蛋白复合物的动态解离轨迹,并通过轨迹重加权计算了结合速率常数,揭示了三种解离机制类型,为训练下一代生成式 AI 模型以预测和优化药物解离动力学提供了关键的大规模数据基础。

原作者: Maodong Li, Dechin Chen, Zhijun Pan, Zhe Wang, Yi Isaac Yang

发布于 2026-04-09
📖 1 分钟阅读☕ 轻松阅读

这是对下方论文的AI生成解释。它不是由作者撰写或认可的。如需技术准确性,请参阅原始论文。 阅读完整免责声明

Each language version is independently generated for its own context, not a direct translation.

这篇论文讲述了一个关于**“药物如何从蛋白质上脱落”的大规模数字实验项目。为了让你更容易理解,我们可以把整个过程想象成一场“超级大逃亡”**的模拟游戏。

1. 核心故事:药物与蛋白质的“分手”

在药物研发中,科学家最关心两件事:

  1. 药物能不能粘住蛋白质?(结合力,决定药效强弱)
  2. 药物能粘多久?(解离速度,决定药效持续时间)

以前的研究就像是在拍一张**“定妆照”**:只看到药物紧紧贴在蛋白质口袋里的那一刻。但这就像只看一张结婚照,不知道他们婚后相处多久、怎么分手的。

这篇论文的团队(来自深圳湾实验室)做了一个大胆的决定:他们不再只拍照片,而是用超级计算机模拟了药物从蛋白质口袋里“逃出来”的全过程。他们把这场“逃亡”拍成了成千上万段高清视频。

2. 他们做了什么?(DD-03B 数据库)

想象一下,以前他们只模拟了 500 对“药物 - 蛋白质”的分手过程(这叫 DD-13M),虽然很珍贵,但样本太少,不够代表性。

这次,他们把规模扩大了28 倍

  • 样本量:他们从公共数据库里抓了19,037种不同的药物和蛋白质组合。
  • 模拟次数:对每一种组合,他们让药物尝试“逃跑”50 次(就像让一个人尝试从迷宫里走出 50 次,看看哪条路最顺)。
  • 数据量:最终生成了76 万多条完整的“逃亡视频”,包含2.9 亿帧画面,数据量高达40 TB(相当于几万个高清电影)。

这个巨大的数据库被命名为 DD-03B。它就像一个**“药物分手百科全书”**,记录了药物是如何一步步从蛋白质口袋里溜走的。

3. 他们发现了什么?(三种“分手”模式)

通过分析这些海量的“逃亡视频”,科学家发现药物离开蛋白质并不是只有一种方式,而是分成了三种性格迥异的“分手模式”

  • 模式一:走大路(路径主导型)

    • 比喻:就像从家里出门,有一条非常明确、笔直的大路通向大门。
    • 特点:药物沿着一条固定的路线滑出来。这种最容易预测,就像走迷宫有唯一出口。
    • 占比:大约一半的情况。
  • 模式二:走小门(开放口袋型)

    • 比喻:就像住在没有围墙的院子里,药物随便往哪个方向走都能出去,没有明显的“路”。
    • 特点:结合得很浅,药物很容易掉出来。以前那种只看“定妆照”的方法对这种比较准,但很难算出它到底能停留多久。
  • 模式三:钻迷宫(熵口袋型)

    • 比喻:就像掉进了一个复杂的、像迷宫一样的深坑。药物在里面转来转去,不仅要克服引力(能量),还要在狭窄的空间里挤来挤去(熵)。
    • 特点:最难预测!药物在里面乱撞,可能走很多弯路才出来。这需要非常高级的算法才能算清楚。

4. 这对未来有什么用?(AI 的“训练场”)

以前,人工智能(AI)在学怎么预测药物效果时,就像是在背静态的地图,它不知道路是怎么走的,只知道起点和终点。

现在,有了 DD-03B 这个数据库,AI 就像拿到了**“全程导航视频”**。

  • 训练 AI:科学家可以用这些视频训练新一代的 AI 模型。
  • 预测未来:未来的 AI 不仅能告诉你药物“粘得紧不紧”,还能精准预测它“能粘多久”(解离速率 koffk_{off})。
  • 加速研发:这意味着我们可以更快地设计出那些**“粘得久、效果好”**的新药,减少试错成本。

总结

简单来说,这篇论文就是把“药物如何从蛋白质上脱落”这个微观过程,从“拍照片”升级到了“拍 4K 高清连续剧”

他们建立了一个巨大的**“药物逃亡视频库”,不仅免费公开给全世界科学家使用,还揭示了药物脱落的三种不同“性格”。这为未来用AI 设计新药**打下了最坚实的基础,让药物研发从“凭感觉猜”走向“精准预测”。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →