DGLD: Domain-Gated Latent Diffusion for the Discovery of Novel Energetic Materials

本文介绍了域门控潜在扩散(DGLD)这一新颖的生成框架,该框架成功发现并验证了两种结构独特、高性能的含能材料(L1 和 E1),其经密度泛函理论(DFT)确认的爆速超过 8 km/s,从而克服了现有模型要么死记硬背训练数据、要么在外推时无法保持性能的局限性。

原作者: Yehudit Aperstein, Alexander Apartsin

发布于 2026-05-27
📖 1 分钟阅读☕ 轻松阅读

原作者: Yehudit Aperstein, Alexander Apartsin

原始论文采用 CC BY 4.0 许可(http://creativecommons.org/licenses/by/4.0/)。 这是对下方论文的AI生成解释。它不是由作者撰写或认可的。如需技术准确性,请参阅原始论文。 阅读完整免责声明

想象一下,你正在尝试发明一种用于火箭或燃气发生器的新型超级燃料。你希望这种燃料威力巨大,同时又足够小巧轻便,便于携带。然而问题在于,过去 15 年里,科学家们尚未发现任何一种能够超越现有冠军(如 HMX 和 CL-20)的新型“超级燃料”分子。

为什么这如此困难?这就像在干草堆里找一根针,但这个干草堆由 66,000 种不同的化学配方组成,而其中仅有约 3,000 种经过真实实验室测试或通过超精确物理模拟验证。其余的只是粗略的猜测。如果你让标准计算机程序设计一种新燃料,它通常只会做两件糟糕的事:要么只是复制它已知的旧配方(死记硬背),要么编造出一些看似纸上谈兵、实则经不起数学验证的荒诞且不可能存在的化学物质。

解决方案:DGLD(领域门控潜在扩散)

作者构建了一种名为DGLD的新型人工智能系统来解决这一问题。可以将 DGLD 想象为一位高度专业化的“化学建筑师”,它通过三步流程来寻找完美的新分子。

1. “信任过滤器”(训练阶段)

想象你在教一名学生成为厨师。你有一本包含 66,000 种配方的食谱。

  • 其中 3,000 种配方是由真正的厨师在真实厨房中测试过的(实验/密度泛函理论数据)。
  • 其余 63,000 种则只是初级助手写下的粗略估算(代理数据)。

如果你让学生品尝所有配方,他们可能会因那些糟糕的估算而困惑,从而学会做出难吃的食物。
DGLD 的诀窍:它在训练过程中设置了一个“信任过滤器”。它告诉人工智能:“在学习具体目标(制造超级燃料)时,只密切关注那 3,000 种经过真实测试的配方。对于其余 63,000 种粗略估算,仅利用它们来学习烹饪的通用规则(分子长什么样),但不要让它们决定最终的味道。”这防止了人工智能被劣质数据误导。

2. “多工具指南针”(采样阶段)

一旦人工智能开始“构想”新分子,它就需要引导。想象人工智能正穿过一片迷雾森林寻找特定宝藏。

  • 标准人工智能要么直线行走,要么随机游荡。
  • DGLD则为人工智能配备了一个多工具指南针。这个指南针拥有六根不同的指针,分别指向不同的方向:它安全吗?它稳定吗?它威力大吗?它易于制造吗?
  • 每当人工智能迈出一步,指南针就会将其轻轻推回正轨。如果人工智能开始偏离向危险或不稳定的分子,指南针会将其推回;如果它偏离向性能较弱的方向,指南针会将其引向更强大的方向。关键在于,人工智能可以随意开启或关闭这些指针,而无需重新学习如何行走。

3. “四阶段安全审查”(验证阶段)

人工智能吐出了一份包含 40,000 种潜在新分子的清单。其中大多数都是垃圾。DGLD 将它们送入一个严格的安全漏斗中进行筛选:

  • 阶段 1(守门员):快速化学规则检查。是否含有危险原子?是否过大?如果是,立即淘汰。
  • 阶段 2(裁判):计算机根据威力、安全性以及与旧配方的差异程度,对幸存者进行排名。
  • 阶段 3(压力测试):快速物理模拟检查分子的电子是否稳定。如果它看起来仅仅因为存在就会爆炸,则予以淘汰。
  • 阶段 4(黄金标准):最终剩下的 12 个候选分子将接受全面、缓慢且超精确的物理审计(称为密度泛函理论,DFT)。这是“真实实验室”级别的模拟。

结果:发现黄金

在完成整个流程后,DGLD 发现了12 种全新分子,它们通过了最终的物理审计。

  • 明星选手(L1):一种名为3,4,5-三硝基 -1,2-异噁唑的分子。它在结构上独一无二(与旧配方截然不同),且性能与我们目前最好的燃料相当。
  • 亚军(E1):另一种来自完全不同家族的新分子,其威力可能更强,尽管需要进一步的安全性检查。

其他方法为何失败

该论文将 DGLD 与三种其他流行的 AI 方法进行了测试:

  • 方法 A(SMILES-LSTM):它就像一个只死记硬背教科书的学生。18% 的情况下,它只是完全复制了旧分子。
  • 方法 B(SELFIES-GA):它发现了一种在快速检查中看起来完美的分子,但在进行真实的物理审计时却崩溃了。这是一个虚假的假象。
  • 方法 C(REINVENT 4):它发现了一些新颖奇特的分子,但它们的威力不足以超越旧有的冠军。

核心结论
DGLD 是唯一一种成功找到了完全新颖实际强大到足以实用分子的方法,且这一切都是在标准计算机硬件上完成的。作者已发布了他们的代码以及这 12 种新分子的清单,以便化学家们能在真实实验室中尝试合成它们。他们估计,只需几天的计算机运行时间,下一代超级燃料就可能被发现并准备好进行合成。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →