Learning Universal Representations of Intermolecular Interactions with ATOMICA

本文介绍了 ATOMICA,一种基于几何深度学习的通用模型,它通过训练超过 200 万种复合物数据,成功构建了涵盖蛋白质、小分子、金属离子、脂质和核酸五种模态的原子级相互作用表示,并在结构功能预测、暗蛋白质组配体发现及实验验证中展现出卓越性能。

Fang, A., Desgagne, M., Zhang, Z., Zhou, A., Loscalzo, J., Pentelute, B. L., Zitnik, M.

发布于 2026-03-16
📖 1 分钟阅读☕ 轻松阅读
⚕️

这是一篇未经同行评审的预印本的AI生成解释。这不是医疗建议。请勿根据此内容做出健康决定。 阅读完整免责声明

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一个名为 ATOMICA 的人工智能模型,它就像是一个**“分子世界的超级翻译官”“万能拼图大师”**。

为了让你更容易理解,我们可以把生物体内的化学反应想象成一场盛大的**“宇宙舞会”**。在这个舞会上,不同的分子(蛋白质、药物、DNA、金属离子等)需要互相认识、牵手、拥抱,才能完成生命活动(比如治病、传递信号)。

1. 以前的模型像什么?

以前的 AI 模型有点像**“单科状元”**:

  • 有的只懂蛋白质(像只认识穿西装的人)。
  • 有的只懂药物(像只认识穿运动服的人)。
  • 有的只懂DNA(像只认识穿校服的人)。

如果让“蛋白质专家”去分析“药物和 DNA 的互动”,它往往就懵了,因为它没学过这种跨界的语言。而且,很多复杂的互动(比如蛋白质和金属离子的结合)因为数据太少,这些“单科状元”根本学不会。

2. ATOMICA 是什么?

ATOMICA 是一个**“全能型外交官”。它不再只盯着某一种分子看,而是直接观察“分子们握手的地方”**(也就是界面)。

  • 核心能力:它学习了超过 200 万 种不同的分子互动案例。无论是蛋白质抱蛋白质、药物抱蛋白质、还是金属离子抱 DNA,它都见过。
  • 它的视角:它不看分子“长什么样”(比如是圆是方),而是看它们**“怎么接触”**。就像它不看你是穿西装还是穿运动服,而是看你们握手时手掌的温度、力度和角度。

3. 它是如何学习的?(两个小游戏)

为了学会这种“万能语言”,科学家给 ATOMICA 设计了两个训练游戏:

  1. “蒙眼复原”游戏(去噪):把两个分子的位置稍微打乱(比如旋转一下、扭动一下),让 ATOMICA 猜它们原本是怎么完美契合的。这让它学会了分子之间的空间几何关系
  2. “猜猜我是谁”游戏(掩码预测):把分子界面上的某一块(比如一个氨基酸或药物片段)遮住,让 ATOMICA 根据周围的环境猜出这块是什么。这让它学会了化学性质

通过这两个游戏,ATOMICA 建立了一个**“通用思维空间”**。在这个空间里,所有分子都被转化成了数字代码(向量)。神奇的是,性质相似的分子,在这个空间里的距离就很近,哪怕它们属于完全不同的类别。

4. 它有什么超能力?(实际应用)

A. 破解“暗物质”蛋白的密码

人体里有很多蛋白质,科学家知道它们长什么样,但完全不知道它们是干什么的,这些被称为**“黑暗蛋白质”**(Dark Proteome)。

  • ATOMICA 的做法:它看着这些“黑暗蛋白质”的口袋形状,就能猜出:“嘿,这个口袋长得像专门用来抓‘血红素’(一种重要的辅因子)的!”
  • 结果:它成功预测了 2600 多个黑暗蛋白质的功能,并且科学家在实验室里真的验证了其中 5 个,发现它们确实能结合血红素!这就像是一个侦探,仅凭脚印就猜出了嫌疑人的职业,并且抓到了真凶。

B. 药物设计的“指南针”

在寻找能阻断蛋白质互动的药物(抑制剂)时,ATOMICA 能帮大忙。

  • 比喻:想象蛋白质 A 和蛋白质 B 正在谈恋爱(相互作用)。我们要找一种药(抑制剂)来拆散它们。
  • ATOMICA 的作用:它能发现,虽然药物和蛋白质 B 长得完全不一样,但在“拥抱的姿势”上,药物和蛋白质 B 非常像。这意味着药物能精准地插进去,把原来的“情侣”挤走。

C. 超越现有的 AI

在测试中,ATOMICA 在预测 RNA 功能和蛋白质结合位点方面,表现比很多专门针对单一任务训练的大模型还要好,而且它只需要很少的计算资源(参数少),却能达到和那些“巨无霸”模型(参数量大几十倍)一样的效果。

总结

ATOMICA 就像是一个通晓所有分子方言的翻译官。它不再把蛋白质、药物、DNA 看作孤立的个体,而是把它们看作一个互动的整体

  • 以前:我们要为每种互动单独造一个翻译机。
  • 现在:ATOMICA 造了一个万能翻译机,只要把分子的结构给它,它就能告诉你它们会怎么互动、有什么功能,甚至能帮我们发现那些被遗忘在“黑暗”中的生命秘密。

这项技术为未来设计新药、理解生命机制打开了一扇全新的大门。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →