UMA: A Family of Universal Models for Atoms

Meta FAIR 发布了名为 UMA 的通用原子模型家族,该家族基于半亿个独特三维原子结构训练,采用创新的混合线性专家架构,在无需微调的情况下即可在药物发现、能源存储等多个领域实现媲美或超越专用模型的速度与精度。

Brandon M. Wood, Misko Dzamba, Xiang Fu, Meng Gao, Muhammed Shuaibi, Luis Barroso-Luque, Kareem Abdelmaqsoud, Vahe Gharakhanyan, John R. Kitchin, Daniel S. Levine, Kyle Michel, Anuroop Sriram, Taco Cohen, Abhishek Das, Ammar Rizvi, Sushree Jagriti Sahoo, Zachary W. Ulissi, C. Lawrence Zitnick

发布于 2026-03-05
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一个名为 UMA (Universal Models for Atoms,原子通用模型) 的突破性人工智能项目,由 Meta 的 FAIR 实验室和卡内基梅隆大学合作开发。

为了让你轻松理解,我们可以把这项技术想象成给化学家和材料科学家造了一个“全能超级大脑”

1. 以前的困境:昂贵的“原子计算器”

在化学和材料科学中,科学家需要知道原子是如何相互作用、结合以及反应的。以前,他们主要依靠一种叫密度泛函理论 (DFT) 的数学方法来计算。

  • 比喻:这就像是用手工算盘来算账。虽然算得极其精准,但速度非常慢。如果你要模拟一个稍微复杂点的分子(比如药物分子),可能需要算上好几天甚至几周。这极大地限制了科学家发现新药或新材料的速度。

2. UMA 的解决方案:一个“全能超级大脑”

Meta 团队训练了一组 AI 模型(UMA),它们的目标是像 DFT 一样精准,但像手机 APP 一样快

  • 比喻:UMA 就像是一个读过全世界所有化学教科书、看过所有实验记录的“超级天才”。你问它一个原子的结构,它不需要重新推导公式,而是瞬间就能根据记忆给出答案,速度比手工算盘快了几百万倍(从几小时缩短到几毫秒)。

3. 核心创新:如何做到既聪明又快速?

A. 海量数据:读遍了“化学宇宙”

以前的 AI 模型通常只专精于某一类东西(比如只懂药物,或者只懂电池材料)。UMA 的不同之处在于,它被喂了5 亿个独特的 3D 原子结构数据。

  • 比喻:以前的模型是“专科医生”,只懂治感冒或只懂治骨折。UMA 则是全科医生,它同时学习了药物、电池材料、催化剂、甚至分子晶体等所有领域的知识。它见过几乎地球上所有可能的原子组合(除了放射性元素),所以它非常博学。

B. 架构创新:Mixture of Linear Experts (MoLE) —— “智能专家团”

这是 UMA 最厉害的地方。通常,模型越大越聪明,但运行起来就越慢、越耗电。UMA 发明了一种叫 MoLE 的架构。

  • 比喻:想象一个拥有 14 亿名员工 的大公司(模型总参数量)。如果每次处理任务都要让所有 14 亿人都同时开会,那效率太低了。
    • 传统做法:每次开会,所有人都得动脑子,累死且慢。
    • UMA 的 MoLE 做法:每次来一个任务(比如计算一个分子的能量),系统会像智能调度员一样,只从 14 亿人中临时挑选 5000 万最合适的专家来开会。
    • 结果:虽然公司总人数(模型容量)巨大,保证了它非常聪明;但每次实际干活的人数(活跃参数)很少,所以速度极快,甚至可以在普通的显卡上运行。

C. 训练策略:先学基础,再练精修

为了训练这个大脑,他们采用了两阶段策略:

  1. 第一阶段:让模型快速学习,直接预测结果(像做选择题,只求快)。
  2. 第二阶段:让模型慢下来,仔细检查能量是否守恒(像做解答题,求准),确保它在模拟物理过程时不会“胡编乱造”。

4. 实际效果:它有多强?

论文测试了 UMA 在各种领域的表现,发现它不需要针对每个任务单独训练,就能直接达到甚至超过那些专门训练的“专科模型”的水平。

  • 药物研发:它能快速计算药物分子和蛋白质的结合能量,帮助科学家更快筛选出有效的药物。
  • 电池与能源:它能准确预测电池材料的性能,加速新能源材料的发现。
  • 催化剂:在寻找能加速化学反应的催化剂方面,它的成功率比之前的顶尖模型提高了 25%。
  • 分子模拟:它可以在单张显卡上模拟包含 10 万个原子的系统,运行速度极快,这让以前需要超级计算机才能完成的模拟变得触手可及。

5. 总结与意义

UMA 就像是化学和材料科学领域的"ChatGPT"时刻。

  • 以前:科学家做实验像“盲人摸象”,因为计算太慢,只能一点点试。
  • 现在:有了 UMA,科学家拥有了一个全知全能的导航仪。它不仅能预测原子行为,还能在几秒钟内探索以前需要几年才能探索的化学反应空间。

Meta 已经公开了代码、模型权重和数据,这意味着全球的科学家都可以免费使用这个“超级大脑”来加速新药研发、清洁能源开发等造福人类的项目。这不仅仅是技术的进步,更是开启了一个AI 驱动科学发现的新时代。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →