原作者： Keyan Chen, Yile Li, Da Long, Zhitong Xu, Wei Xing, Jacob Hochhalter, Shandian Zhe

发布于 2026-02-05

📖 1 分钟阅读☕ 轻松阅读

原作者： Keyan Chen, Yile Li, Da Long, Zhitong Xu, Wei Xing, Jacob Hochhalter, Shandian Zhe

原始论文采用 CC BY 4.0 许可（http://creativecommons.org/licenses/by/4.0/）。 ✨ 这是对下方论文的AI生成解释。它不是由作者撰写或认可的。如需技术准确性，请参阅原始论文。阅读完整免责声明

想象一下，你正在试图教一名学生如何预测天气。通常，要做好这件事，你需要一个庞大的过去天气数据库（数千年的记录）以及一本解释精确物理定律（热力学、流体力学等）的教科书。

然而，在许多现实世界的工程问题中——比如预测金属桥梁上的裂纹如何生长，或者热量如何在复杂材料中扩散——你会面临两个大问题：

你没有足够的数据： 运行现实世界的模拟来获取数据是非常昂贵且缓慢的。你可能只有 10 或 20 个样本，而不是数千个。
你不知道确切的规则： 控制这些复杂系统的物理规律可能太复杂了，无法用简单的教科书方程写下来。

这正是 “伪物理信息神经算子”（Pseudo-Physics-Informed Neural Operators, PPI-NO） 这篇论文试图解决的问题。

核心思想：从零开始学习“经验法则”

作者提出了一个巧妙的两步走策略，旨在帮助计算机在数据极少、甚至不知道真实物理定律的情况下进行更好的学习。

第一步：“侦探”（伪物理网络）

首先，计算机扮演一名侦探的角色，观察它拥有的少量样本（例如：“这里是热源，这里是产生的温度分布”）。它不仅仅是死记硬背答案，而是尝试推测“因”与“果”之间的关系。

它会问：“如果我稍微改变这里的温度，附近的热量流动会如何变化？”

它构建了一个**“伪物理”模型**。可以把这想象成一个并不了解官方物理教科书定律，但仅通过观察给定的少量样本，就摸索出了一套“经验法则”的学生。

技巧： 论文指出，物理定律通常依赖于局部变化（即紧邻某一点发生的变化）。因此，计算机通过观察一个点及其直接相邻的点来推测规则。
结果： 它创建了一个“黑盒”方程。它可能不是宇宙的真实定律，但对于数据中的模式而言，它是一个足够好的近似。作者称之为**“伪物理”**，因为它是一个从数据中学习到的“假”物理系统，而不是从教科书中学习到的真实物理。

第二步：“老师与学生”循环

现在，计算机有两个部分在协同工作：

预测器（学生）： 这是试图预测结果（例如温度分布图）的主 AI。
伪物理模型（老师）： 这是来自第一步的“经验法则”模型。

它们进行一场“相互制衡”的游戏：

学生做出一个预测。
老师检查：“根据我学到的规则，你的预测合理吗？”
如果学生的预测违反了老师的规则，老师就会说：“不，这不符合模式，”然后学生进行自我修正。
它们轮流提升。学生变得更擅长预测，老师也变得更擅长理解规则。

为什么这意义重大

通常，如果数据不足，AI 模型会做出荒谬的猜测或遗漏重要细节。如果你试图强迫它们遵循真实的物理学，你需要专家写下精确的方程，而对于复杂问题，这往往是不可能的。

PPI-NO 就像是给 AI 提供了一个由其自身经验构成的“拐杖”。

没有 PPI-NO： AI 就像一个只有 5 个例子且没有教科书的学生。它会胡乱猜测。
有了 PPI-NO： AI 就像一个在看到 5 个例子后，迅速总结出了一套“经验法则”（例如：“数字通常呈曲线增长”）的学生。即使这个规则不是 100% 完美，它也能帮助学生比单纯瞎猜时更准确地解决问题。

这篇论文实际发现了什么

作者在五个标准的数学问题（如流体流动和热扩散）和一个现实世界的工程问题（预测裂纹金属板中的应力）上进行了测试。

结果： 当数据极少（仅有 5 或 10 个样本）时，PPI-NO 方法比标准 AI 模型降低了 30% 到 90% 以上 的误差。
“伪”的含义： 作者承认，AI 学到的“物理”是不可解释的（你无法像阅读人类可读的方程那样去阅读它）。它是一个“黑盒”。然而，它在进行准确预测方面表现得极其出色。
权衡： 训练“老师”和“学生”需要更多的计算时间，但在数据稀缺的情况下，其带来的精度提升是巨大的。

总结

这篇论文介绍了一种方法，让 AI 从微量数据集中学习其自身的“伪物理”规则，并利用这些规则来教导自己如何做出更好的预测。这是一种无需专家编写定律、也不需要数千个昂贵数据点，就能获得物理启发式学习优势的方法。

提到的关键局限性： 作者指出，这种方法是一种“预测工具”，而非“发现工具”。它能帮你准确预测结果，但由于它学习的“规则”是一个黑盒，你无法利用它来发现新的、人类可读的自然法则。它是用于预测的“拐杖”，而不是用于发现的“显微镜”。

技术摘要：伪物理信息神经算子 (PPI-NO)

问题陈述

神经算子（如傅里叶神经算子 FNO、深度算子网络 DONet）已展示出作为求解偏微分方程 (PDE) 代理模型的巨大潜力。然而，它们的最佳性能通常依赖于大量的训练数据，而在断裂力学和气候建模等复杂应用中，获取这些数据的成本往往极高或根本无法实现。

现有的物理信息神经算子 (PINO) 试图通过在训练过程中引入作为软约束的已知物理定律来缓解数据稀缺问题。然而，这种方法需要对底层控制方程有深入的理解，而对于现实世界中的复杂系统，这些方程往往是不可知或难以识别的。因此，需要一种能够利用物理原理来增强算子学习，且无需显式、基准真值知识的框架。

方法论

作者提出了伪物理信息神经算子 (PPI-NO) 框架。该方法利用从初步物理原理（具体而言是基础微分算子）导出的偏微分方程来构建一个“代理物理系统”，而非使用基准真值定律。该框架通过神经算子与学习到的伪物理网络之间的交替更新与学习过程进行运作。

1. 伪物理系统学习

驱动该方法的核心观察是：虽然从输入 $f$ 到输出 $u$ 的映射是全局性的，但底层的 PDE 系统通常是 $u$ 及其导数的局部组合。

神经 PDE 近似： 作者设计了一个神经网络 $\phi$ 来近似方程 $N[u](x) = f(x)$ 中的微分算子 $N$ 的一般形式。该网络以解 $u$ 及其有限差分导数近似值 ( $S_1(u), \dots, S_Q(u)$ ) 作为输入来预测源项 $f$ 。
架构： 为了处理 PDE 的局部组合特性并补偿有限差分近似中的信息损失， $\phi$ 采用了一个卷积层来聚合邻域信息，随后在每个采样位置使用全连接层 (MLP) 来预测 $f$ 。
训练： $\phi$ 使用 $L_2$ 损失进行训练，以最小化不同训练数据中预测源项与实际源项 $f$ 之间的差异。

2. 与神经算子的耦合

学习到的伪物理网络 $\phi$ 与神经算子 $\psi$ （例如 FNO 或 DONet）相结合，通过重构误差来增强学习。

损失函数： 神经算子 $\psi$ 的总损失包括标准的拟合数据损失 ( $L_{data}$ ) 和一个物理信息重构项 ( $L_{physics}$ )。
$L = \sum L_2(\psi(f_n), u_n) + \lambda \cdot \mathbb{E}_{f'} [L_2(f', \phi(\psi(f')))]$
机制： 算子 $\psi$ 从输入 $f'$ 预测解 $\hat{u}$ 。该预测结果被输入到伪物理网络 $\phi$ 中以重构源项 $\tilde{f}$ 。原始输入 $f'$ 与重构后的 $\tilde{f}$ 之间的差异作为正则化项，促使 $\psi$ 生成与学习到的伪物理流形一致的解。
交替优化： 该框架迭代地精炼这两个组件：
1. 固定 $\phi$ ，微调 $\psi$ 。
2. 固定 $\psi$ ，微调 $\phi$ 。
  此循环持续进行直到收敛，使得物理表示与算子能够相互增强。

核心贡献

论文确定了三个主要贡献：

首次数据驱动的物理增强： 据作者所知，PPI-NO 是首个通过从有限数据中直接学习物理定律来增强标准算子学习流水线的成果，在无需深层物理理解或大规模数据收集的情况下实现了更高的精度。
新的物理信息学习范式： 该方法建立了一种新范式，即仅需初步的物理假设（基础微分运算），而非严谨的专家知识。这扩展了物理信息学习的应用范围，使其适用于具有不同水平领域知识的专家。
经验验证： 其有效性在五个基准任务（达西流、非线性扩散、Eikonal 方程、Poisson 方程和对流方程）以及一个现实世界的疲劳建模应用（预测半椭圆表面裂纹的应力强度因子 SIF）中得到了验证，在后者中，整体性的基准真值 PDE 是未知的。

实验结果

作者使用 FNO 和 DONet 架构评估了 PPI-NO，涵盖了不同的训练集规模（基准任务为 5 至 30 个样本，疲劳应用为 400–600 个样本）。

性能提升： 在数据稀缺场景下，PPI-NO 显著降低了相对于标准算子的相对 $L_2$ $L_{2}$ 误差。
- 达西流 (Darcy Flow)： 在 5–30 个训练样本的情况下，PPI-FNO 比标准 FNO 的误差降低了 65–75%。
- 非线性扩散 (Nonlinear Diffusion)： PPI-FNO 实现了超过 93% 的误差降低。
- 疲劳建模 (Fatigue Modeling)： 在 SIF 预测任务中，对于 400 和 500 个训练规模，PPI-NO 将误差降低了 30% 以上。
定性改进： 可视化显示，在数据有限时，标准算子往往会丢失局部结构或学习到错误的模态。PPI-NO 成功恢复了这些局部细节和结构，在高误差区域实现了近乎为零的点对点误差。
与基准真值 PINO 的比较： 当与在 Poisson 和 Advection 任务上使用基准真值物理进行训练的 PINO 进行比较时，尽管缺乏可解释性，PPI-NO 仍达到了接近真实物理信息基准的性能。
消融研究：
- 卷积层： 在 $\phi$ 中包含卷积层显著提高了伪物理预测的准确性。
- 导数阶数： 使用最高二阶导数能获得最佳的算子学习性能；更高阶（三阶）会导致轻微过拟合。
- 数据丰富度： 当训练数据充足（600–1000 个样本）时，PPI-NO 与标准算子之间的性能差距缩小，这表明该方法在低数据量阶段最为关键。
- 系统识别 vs. 联合训练： 使用 SINDy 在训练算子之前先识别方程的顺序方法，表现不如 PPI-NO 的联合交替训练，这突显了相互优化的益处。

重要性与局限性

重要性：
论文指出，PPI-NO 提供了一个简单且有效的框架，用于直接从数据中提取隐式物理定律。它证明了即使是“黑盒”式的伪物理表示（可能并不镜像真实的物理定律），也能在数据稀缺的情况下大幅提升算子学习的准确性。这对于那些未知或难以显式推导控制方程的复杂应用特别具有价值。

局限性（如作者所述）：

PDE 的范围： 目前的验证局限于标准基准测试，尚未涵盖高度非线性、多尺度的 PDE（如 Navier-Stokes 或 Euler 方程），这类方程可能会导致训练不稳定。
过拟合与伪影： 伪物理网络 $\phi$ 可能会过拟合并捕捉到虚假的规律或离散化伪影，从而可能作为一个误导性的先验。
可解释性： 该方法以牺牲可解释性来换取预测灵活性。学习到的“物理”是一个黑盒，因此不适用于需要显式、人类可读定律或正式保证的工作流。
网格相关性： 由于空间相关性，用于训练 $\phi$ 的有效样本量小于原始网格点总数，这可能导致对不确定性的估计不足。
初始条件： 当前框架无法学习将输入函数 $f$ 作为初始条件的 PDE 表示，因为这需要反向时间积分，从而阻碍了导数的解耦。

作者总结道，虽然 PPI-NO 是一个强大的预测工具，适用于特定的数据区间，但应将其视为一种预测代理，而非确定性定律发现的工具。

Pseudo-Physics-Informed Neural Operators: Enhancing Operator Learning from Limited Data