原作者： Anmar Karmush, Cedric Mathieu Brandenburg, Soheil Ershadrad, Johanna Rosén, Michael Felsberg, Filip Ekström Kelvinius

发布于 2026-05-12

📖 1 分钟阅读☕ 轻松阅读

查看于 arXiv ↗PDF ↗

CC BY 4.0

原作者： Anmar Karmush, Cedric Mathieu Brandenburg, Soheil Ershadrad, Johanna Rosén, Michael Felsberg, Filip Ekström Kelvinius

原始论文采用 CC BY 4.0 许可（http://creativecommons.org/licenses/by/4.0/）。 ✨ 这是对下方论文的AI生成解释。它不是由作者撰写或认可的。如需技术准确性，请参阅原始论文。阅读完整免责声明

想象你是一位首席建筑师，试图从零开始设计新的、稳定的建筑（材料）。在科学世界中，这些“建筑”就是晶体，它们由按重复模式排列的原子构成。

长期以来，试图设计这些晶体的计算机程序就像是不懂对称性规则的建筑师。它们会尝试逐个绘制每一块砖（原子），希望计算机最终能明白建筑在左侧和右侧看起来应该是一样的。不幸的是，这往往导致“建筑”看起来怪异、不稳定，或者在现实世界中根本行不通。

本文介绍了一种名为SymADiT的新方法。你可以将其理解为给建筑师提供了一套已包含对称性规则的蓝图，因此他们无需再猜测。

以下是其工作原理，分解为简单步骤：

1. 问题：绘制每一块砖 vs. 绘制图案

想象你正试图向朋友描述一片雪花。

旧方法（对称性无关）： 你尝试描述雪花中每一个水分子的确切位置。这是一份巨大的数字列表，如果你犯了一个微小的错误，整片雪花看起来就会破碎。
新方法（对称性感知）： 你说：“它是一个六角星。如果我画出一个角，其余五个角只是该角的旋转复制品。”你只需要描述一个角，对称性规则会自动填补其余部分。

作者将这种方法称为使用“Wyckoff 位置”。你可以将这些位置理解为晶体中原子被允许坐落的特定“槽位”。有些槽位被固定（就像钉在木板上的钉子），有些可以沿直线滑动，还有些可以自由移动。新方法只要求计算机决定原子在“自由”槽位中的位置。固定槽位则由规则自动处理。

2. 工具：两阶段工厂

作者构建了一个两步机器来创造这些材料：

第一阶段：压缩器（自编码器）
想象你有一个巨大且杂乱的晶体蓝图图书馆。第一台机器（自编码器）将这些蓝图压缩成微小的、高效的“摘要卡片”（潜在表示）。它学会只保留关键信息——那些实际发生变化的部分——同时丢弃那些仅仅是彼此复制的冗余细节。
第二阶段：生成器（流匹配）
一旦蓝图被压缩成摘要卡片，第二台机器（生成器）就学会从纯噪声（随机静态）中创建新的摘要卡片。这就像一位 DJ 从静态噪音开始，慢慢将其塑造成旋律来混音一首新歌。由于摘要卡片已经遵守了对称性规则，它创建的新歌曲（晶体）自动具有对称性和稳定性。

3. 结果：更好的建筑

作者将他们的新型"SymADiT"机器与旧模型进行了测试。

旧模型： 通常产生的晶体本质上只是没有真正对称性的随机原子堆（就像没有图案的一堆砖块）。它们看起来像"P1"晶体，这是科学术语，意为“完全没有对称性”。
SymADiT： 产生的晶体看起来像现实世界中的材料。它们具有正确的对称性、正确的形状，并且更有可能稳定（意味着它们不会立即分崩离析）。

为什么这很重要（根据论文）

论文声称，通过从一开始就强制计算机遵守对称性（使用"Wyckoff"槽位），他们可以使用更简单、标准的计算机大脑（Transformer）来比复杂、专门的模型做得更好。

他们发现他们的方法：

创造逼真的形状： 晶体看起来像是自然界中实际可能存在的东西。
高效： 它不需要处理数百万个不必要的细节，因为对称性规则承担了繁重的工作。
具有竞争力： 在寻找稳定且独特的材料方面，它的表现与其他顶级方法一样好，甚至更好。

简而言之，作者不再要求计算机通过试错来学习对称性规则，而是将规则直接构建到计算机的“语言”中，使其能够以更少的精力设计出更好的材料。

技术摘要：利用潜在流匹配生成对称材料

问题陈述

新材料的发现对于推动能源存储和碳捕获等领域的发展具有重大潜力。生成模型已成为探索未开发材料巨大组合空间的主要工具。然而，现有方法在晶体材料的内在对称性方面存在两个根本性缺陷：

冗余性：对称无关的表示（例如完整晶胞）包含了因材料对称性而确定的结构细节，这些细节是冗余的。
不可信性：尽管对称无关模型在生成新结构方面行之有效，但它们通常生成的晶体仅表现出平移对称性（空间群 P1）。这对于现实世界材料而言极不可信，因为绝大多数结构都具有更高的对称性。此外，这些模型通常需要多个生成组件来分别处理连续变量和离散变量。

最近的对称感知方法试图通过使用基于 Wyckoff 位置的表示来解决这一问题，但许多方法仍直接在数据空间操作，或依赖于复杂的多阶段生成过程。

方法：SymADiT

作者提出了 SymADiT（对称感知全原子扩散 Transformer），这是一个将对称性约束直接整合到表示和生成过程中的生成框架。该方法建立在 All-atom Diffusion Transformer (ADiT) 之上，但修改了输入表示和生成策略，以通过设计强制实施对称性。

1. 对称感知表示（Wyckoff 位置）

SymADiT 不使用完整晶胞来表示晶体，而是利用基于 Wyckoff 位置的非对称单元 (ASU) 表示。

核心概念：一旦指定了空间群 ( $G$ )，结构自由度 (DOF) 即受到约束。模型仅预测自由参数（那些不受空间群约束的参数），而所有其他结构细节则被确定性推断。
输入元组：晶体表示为 $(G, W, A, F, \ell)$ ，其中 $G$ 是空间群， $W$ 是 Wyckoff 位置， $A$ 是原子类型， $F$ 是分数坐标， $\ell$ 是晶格参数。
效率：通过在对称轨道（代表元）而非单个原子上进行操作，与 ADiT 相比，输入令牌的数量显著减少（例如，在 MP20 数据集上，每个样本从约 45 个令牌减少到约 10 个令牌）。

2. 两阶段训练框架

该方法遵循受 ADiT 启发的两阶段流程，但针对对称感知表示进行了调整：

阶段 1：自编码器 (AE)

编码器：将每个轨道的 ASU 属性映射到潜在表示 $z_i$ 。它利用 Transformer 架构，结合局部信息（原子类型、Wyckoff 位置、坐标）与全局信息（空间群、晶格参数）。
解码器：从潜在空间重建 ASU。至关重要的是，解码器包含对称化函数 ( $SG[\cdot]$ 和 $S_W[\cdot]$ )，它们根据预测的空间群和 Wyckoff 位置确定性地将受限参数设为特定值。例如，如果某个 Wyckoff 位置将原子限制在一条线上（1 个自由度），则网络对其他两个坐标的预测将被忽略。
损失：重建损失仅应用于 ASU 的自由参数。在潜在空间中，使用饱和函数进行正则化，而非 KL 散度。

阶段 2：潜在流匹配

生成模型：在 AE 学习的潜在空间中，训练一个扩散 Transformer (DiT) 来生成潜在表示 $Z$ 。
流匹配：模型学习一个向量场，通过线性插值将噪声样本转换为干净的潜在样本。
条件控制：生成过程使用无分类器引导以空间群 ( $G$ ) 和轨道数量 ( $O$ ) 为条件。这使得模型能够采样空间群分布并生成相应的对称结构。
采样：在生成过程中，模型依次采样 $G$ 、 $O$ ，然后是潜在向量 $Z$ 。随后，解码器重建完整的 ASU，并利用对称操作（例如通过 PyXtal 库）将其扩展为完整晶体。

主要贡献

对称感知表示：作者引入了一种基于 Wyckoff 位置的表示，显式编码晶体对称性，将模型限制为仅预测无约束的自由度。
SymADiT 框架：他们将 ADiT 框架适配到这种表示中，创建了一个在潜在空间中运行的对称感知变体。这使得可以使用标准的 Transformer 骨干网络，而无需复杂的等变层或多组件生成机制。
潜在空间对称生成：本文证明了在此特定问题上，对称感知生成可以在潜在空间中有效进行，这是此前未探索过的设置，与大多数在数据空间操作的现有方法形成对比。
基准测试：该方法与对称感知和对称无关模型进行了基准测试，在生成稳定、对称的材料方面表现出具有竞争力的性能。

实验结果

该模型在 MP20 和 MPTS52 数据集上进行了评估，与最先进的对称感知模型（如 SGEquiDiff、SymmCD、DiffCSP++）和对称无关模型（如 ADiT、CrystalDiT、MatterGen）基线进行了比较。

对称性真实性：对称无关模型难以捕捉内在对称性，ADiT 和 CrystalDiT 生成的结构中超过 98% 属于 P1 空间群（纯平移）。相比之下，SymADiT 生成的结构具有真实的对称性分布，仅约 0.07% 落入 P1，与训练数据分布高度吻合。
分布指标：SymADiT 在空间群和 Wyckoff 位置分布上实现了低 Jensen-Shannon 散度 (JSD)，表明其成功学习了对称晶体的统计特性。
稳定性：使用密度泛函理论 (DFT) 对 100 个结构有效、独特且新颖的样本进行测试，SymADiT 的（亚）稳定性率为 13.82%（100 个样本中有 30 个为亚稳态）。这一性能与其他对称感知方法相当或更优，并与顶级基于 DiT 的对称无关模型相当。
可扩展性：在更大的 MPTS52 数据集以及组合的 MP20+MPTS52 数据集上的实验表明，该模型具有稳健的可扩展性。将模型规模增加到 4.5 亿参数 (SymADiT-L) 并未显著提高新颖性，这表明 1.3 亿参数的模型已足够。

意义与主张

本文声称，SymADiT 通过在表示层面强制实施对称性，而非依赖网络隐式学习，成功解决了对称无关模型的局限性。

设计优于学习：通过 Wyckoff 位置编码对称性，模型确保生成的材料“按设计”具有真实的对称性属性。
简洁性：作者强调，这些改进是利用简单、现成的 Transformer 架构结合潜在流匹配实现的，无需额外的架构修改（如等变层）。
效率：输入令牌的减少（由于基于轨道的表示）以及单一机制的生成过程（潜在空间），提供了一种比需要分别处理离散和连续变量的方法更高效的途径。

作者总结道，虽然他们的模型能够生成高质量、对称且稳定的材料，但目前并未提供如何合成这些材料的指导，将合成路径确定为未来工作的开放性问题。

Generating Symmetric Materials using Latent Flow Matching