Data-model Coevolution as the Architectural Principle for AI-Native Materials Databases

本文提出并验证了“数据-模型共演化”作为人工智能原生材料数据库的一项基础架构原则,通过一个 Li-P-S 三元原型系统证明了内生性的“生成-评估-优化”循环能够自主发现新型稳定相,并在以极低第一性原理计算成本的基础上实现高精度预测建模。

原作者: Fengyu Xie, Ruoyu Wang, Taoyuze Lv, Yuxiang Gao, Hongyu Wu, Zhicheng Zhong

发布于 2026-06-09
📖 1 分钟阅读☕ 轻松阅读

原作者: Fengyu Xie, Ruoyu Wang, Taoyuze Lv, Yuxiang Gao, Hongyu Wu, Zhicheng Zhong

原始论文采用 CC BY 4.0 许可(http://creativecommons.org/licenses/by/4.0/)。 这是对下方论文的AI生成解释。它不是由作者撰写或认可的。如需技术准确性,请参阅原始论文。 阅读完整免责声明

想象一下,你正试图为一种特定类型的材料(在这种情况下是锂、磷、硫的混合物)构建一个终极晶体结构库。

旧方法:静态库
传统上,科学家们构建这些库就像是在建立一个静态档案库。他们使用一套固定的规则来生成数以千计的晶体形状,利用超级计算机计算它们的性质,然后将它们仅仅是“存档”。用于预测性质的计算机模型就像是外部顾问,他们被聘请过来,给出建议,然后离开。库的增长只是通过添加更多文件来实现,但“大脑”(AI 模型)并不会从新文件中学习,文件也不会根据大脑学到的知识而改变。这是一个单行道。

新方法:自我进化的花园
这篇论文提出了一种新的架构原则,称为**“数据-模型共进化”。请不要将其视为一个图书馆,而是一个生机勃勃、自我照料的花园**。

  1. 种子(生成器): 一个 AI “园丁”播种(生成候选晶体结构)。
  2. 土壤测试(评估器): 另一个 AI “测试员”检查土壤(评估这些晶体的稳定性),使用的是一种快速且智能的近似方法。
  3. 专家检查(精炼): 对于最有潜力的植物,一位人类水平的专家(一种极其精确的计算机模拟,即 DFT)会进行深度检查。
  4. 生长循环: 这里的魔力在于:专家检查的结果不仅仅是被存档。它们会被反馈给园丁和测试员。
    • 园丁学习到: “噢,我不应该种长成那样的种子;它们长不好。下次我会尝试不同的形状。”
    • 测试员学习到: “因为见过这些新植物,我现在可以更准确地预测土壤质量了。”

在这个系统中,数据库(花园)和 AI 模型(园丁和测试员)共同进化。它们是同一个生命系统的不可分割的部分。

他们实际做了什么
研究人员在一种复杂的化学混合物——锂、磷、硫(Li-P-S)上测试了这个“生命花园”。这是一个棘手的系统,就像是在贫瘠的土壤中尝试种植一种稀有、异域的植物。

  • 快速成熟: 在这个循环仅经过 两到三轮 之后,AI 模型就变得异常敏锐。它们达到了这样的精度水平:能够预测能量和力的准确度几乎与缓慢且昂贵的专家模拟相当,但速度却快得多。
  • 填补空白: 系统不仅仅是复制它之前见过的内容。它发现了世界上现有的最大数据库(如 Materials Project)中所缺失的新型稳定晶体形状
    • 它发现了一个名为 Li₂PS₃ 的晶体稳定版本,专家知道它在现实中存在,但在数字数据库中从未被发现过。
    • 它发明了全新的分子“形状”(例如原子构成的环和链),这些形状在训练数据中从未出现过,但在化学上是合理的。
  • “饱和”信号: 研究人员注意到,在几轮之后,花园停止产生新型的基础构建模块。它已经探索了该特定化学混合物中原子结合的所有可能方式。这告诉他们:“我们已经覆盖了这片领地,不需要再继续瞎猜了。”

结果:通用查询工具
一旦花园“稳定”下来(模型经过训练且数据保持一致),研究人员就可以直接向数据库提出任何问题。他们不需要为每一个问题都构建一个新工具。他们可以询问:

  • “这些晶体中哪些是稳定的?”
  • “哪些能让锂离子快速通过它们(对电池有利)?”
  • “这些晶体内部的电子是如何分布的?”

该系统使用同一个统一框架回答了所有这些问题。

大局观
论文认为,我们不应该只是建立越来越大的静态数据堆,而应该构建 AI 原生数据库。这些是数据与 AI 模型在闭环中共同增长的系统。这使得科学家能够探索特定的化学系统,掌握它,然后将这种“成熟”状态作为探索相关系统的基础。它将数据库从一个被动的存储单元转变为一个主动的学习型合作伙伴,助力科学发现。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →