Empirical Stability Analysis of Kolmogorov-Arnold Networks in Hard-Constrained Recurrent Physics-Informed Discovery

本文实证研究了将 Kolmogorov-Arnold 网络(KAN)集成到硬约束循环物理信息架构中,发现尽管 KAN 在处理单变量多项式残差时具有一定竞争力,但其在深层配置中表现出严重的超参数脆弱性和不稳定性,且在处理乘法项(如范德波尔系统)时表现不如标准 MLP,揭示了原始 KAN 公式中加法归纳偏置在状态耦合方面的局限性。

Enzo Nicolas Spotorno, Josafat Leal Filho, Antonio Augusto Medeiros Frohlich

发布于 2026-03-06
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文就像是一次**“新工具测试报告”。研究人员试图把一种名为KAN(柯尔莫哥洛夫 - 阿诺德网络)**的新型人工智能模型,安装到一种专门用来学习物理规律的“硬核”系统中,看看它能不能比传统的旧工具(MLP)更聪明、更准确地发现未知的物理公式。

为了让你轻松理解,我们可以把这项研究想象成**“寻找丢失的拼图”**。

1. 背景:我们在找什么?

想象你有一台复杂的机器(比如一个摆动的钟摆),你知道它大部分是怎么动的(比如重力、摩擦力),但有一部分动力来源是未知的(比如某种神秘的阻力)。

  • HRPINN(旧系统):就像一个经验丰富的老工匠。他手里拿着已知的物理规则(比如牛顿定律),只负责修补那个“未知的部分”。他的工作是把这块“拼图”补上,让机器跑得更准。
  • KAN(新工具):最近很火的一种新式智能绘图笔。它的理论是:任何复杂的图形都可以拆解成许多简单的“单线条”画出来的。研究者希望用它来画那块“未知的拼图”,因为它理论上更容易发现简单的数学规律(比如 x3x^3)。

2. 实验:两个不同的“谜题”

研究者选了两种不同的机器来测试这个新工具:

  • 谜题 A:杜芬振子(Duffing)

    • 特点:这个谜题的未知部分很简单,就像是一个单人的独舞。它的规律只跟一个变量有关(比如 x3x^3)。
    • 结果:KAN 表现不错!它像是一个擅长画单线条的画家,很快就把这个简单的形状画出来了,甚至比老工匠(MLP)画得更像。
  • 谜题 B:范德波尔振子(Van der Pol)

    • 特点:这个谜题的未知部分很复杂,像是双人舞。它需要两个变量互相配合(比如 (1x2)v(1-x^2)v,速度和位置要相乘)。
    • 结果:KAN 彻底崩溃了。无论怎么调整参数,它都画不出那个复杂的“双人舞”形状。它要么画成一条直线,要么画得乱七八糟,甚至完全失效。而老工匠(MLP)虽然笨一点,但能稳稳地画出这个复杂的互动关系。

3. 核心发现:为什么新工具会“翻车”?

这就好比**“积木”和“乐高”的区别**:

  • KAN 的弱点(加法思维)
    KAN 的设计初衷是把复杂的图拆解成很多独立的单线条(加法思维:f(x)+g(y)f(x) + g(y))。

    • 在“单人舞”(杜芬)中,这很完美。
    • 但在“双人舞”(范德波尔)中,你需要的是乘法xxyy 互相影响)。虽然理论上 KAN 可以通过把很多层积木叠起来(深层网络)来模拟乘法,但在实际训练中,这种层层叠加就像是在走钢丝。只要有一层稍微歪一点,在反复循环(递归)的过程中,误差就会像滚雪球一样越来越大,导致整个系统崩塌
  • MLP 的优势(乘法思维)
    传统的 MLP 就像是一个全能工具箱。它在一开始就把所有变量混合在一起(矩阵乘法),直接处理“双人舞”的互动。虽然它画不出那么完美的“单线条”公式,但它非常稳定,不会轻易崩溃。

4. 结论:新工具还没准备好“独挑大梁”

这篇论文告诉我们:

  1. KAN 很聪明,但很脆弱:在处理简单的、独立的物理规律时,它很有潜力,甚至能发现漂亮的数学公式。
  2. 但在复杂互动面前,它还不行:当物理规律需要变量之间“互相打架”或“紧密合作”(乘法耦合)时,目前的 KAN 在反复循环的系统中太不稳定了,容易“走火入魔”。
  3. 未来的方向:虽然现在的 KAN 在“硬约束”的循环系统中表现不佳,但这并不意味着它没希望。未来的研究可能需要给 KAN 加上“稳定器”(比如混合架构或特殊的训练方法),让它既能保持发现公式的才华,又能像老工匠一样稳如泰山。

一句话总结
研究人员发现,这种新式的“智能绘图笔”(KAN)在画简单的直线时很惊艳,但一旦要画复杂的曲线互动,它就容易手抖崩溃;而传统的“老工匠”(MLP)虽然不够灵活,但在处理复杂互动时反而更靠谱。这项研究给未来的物理 AI 发展敲了一记警钟:在追求“可解释性”之前,先要保证“稳定性”。