An Empirical Investigation of Neural ODEs and Symbolic Regression for Dynamical Systems

本文表明,将用于有效数据外推的神经常微分方程(NODEs)与用于方程恢复的符号回归(SR)相结合,为从有限且含有噪声的数据中发现支配物理规律提供了一种极具前景的混合方法。

原作者: Panayiotis Ioannou, Pietro Liò, Pietro Cicuta

发布于 2026-01-29
📖 1 分钟阅读☕ 轻松阅读

原作者: Panayiotis Ioannou, Pietro Liò, Pietro Cicuta

原始论文采用 CC BY 4.0 许可(http://creativecommons.org/licenses/by/4.0/)。 这是对下方论文的AI生成解释。它不是由作者撰写或认可的。如需技术准确性,请参阅原始论文。 阅读完整免责声明

想象一下,你正试图弄清楚一个游戏的规则,但你手头只有几段模糊、抖动的游戏视频片段。你想写下支配这个游戏的精确物理定律,但数据很杂乱,而且你没有足够的视频画面来清晰地观察一切。

这篇论文讲述了一群科学家如何尝试利用两种人工智能的“超能力”来解决这个问题:神经常微分方程(Neural ODEs)符号回归(Symbolic Regression)

以下是他们所做工作及发现的简单拆解,使用了日常生活的类比。

两种超能力

  1. Neural ODEs(直觉艺术家):
    把它想象成一个通过观察几秒钟弹跳球的运动,从而学习球运动“感觉”的 AI。它非常擅长预测球下一步会去哪里,即使你还没向它展示过那个特定的位置。然而,它是一个“黑盒”。它能告诉你球会在哪里,但无法用简单的数学术语解释“为什么”。它就像一位可以通过味觉完美重现一道菜,却写不出食谱的厨师。

  2. 符号回归(侦探):
    这是一种通过观察数据并尝试寻找背后实际数学公式(即食谱)的 AI。它想要找到的是 $F = ma$ 这样的方程,而不仅仅是预测运动。问题在于,这个侦探需要大量清晰、高质量的证据才能破案。如果证据太嘈杂或太稀缺,它就会感到困惑。

实验:两个测试案例

研究人员在两个不同的系统上测试了这些工具:

  • 倒立摆(Cart-Pole): 想象一个在移动小车上保持平衡的杆子。科学家们想看看 AI 是否能预测如果小车以一种新的方式移动,这根杆子会如何倒下。
  • 生物模型(Bio-Model): 一个模拟细菌在食物供应变化时进行适应的系统。他们想看看 AI 是否能弄清楚支配细菌生长的生物学规则。

研究人员在数据中加入了“噪声”(就像收音机的静电干扰)以使其更具现实挑战性且更难处理。

核心发现

1. 艺术家可以画出界外的线条(外推能力)

研究人员发现,“直觉艺术家”(Neural ODE)在预测它未曾见过的场景时表现得惊人地好,但前提是新场景的感觉与旧场景相似。

  • 类比: 如果你教一个 AI 如何在晴天开车,它可以猜出在阴天如何开车,因为物理机制是一样的。但如果你要求它在月球上开车,它可能会失败,因为“动态相似性”消失了。
  • 结果: AI 不需要看到每一种可能的起始位置。它只需要看到足够多的运动“类型”来理解底层的节奏。一旦理解了节奏,它就能准确预测未来,甚至对于比训练时间长得多的时间段也能准确预测。

2. 侦探需要正确的线索(输入变量)

当“侦探”(符号回归)尝试从嘈osa的(嘈杂的)数据中寻找数学方程时,它成功了,但有一个条件:它需要正确的原料。

  • 类比: 想象你在试图解开一个关于蛋糕的谜团。如果你只给侦探面粉和糖,他们可能会猜出食谱。但如果食谱还需要一种“秘密香料”(一个特定的变量),而你没把这种香料给他们,他们就会写出一个错误的食谱。
  • 结果: 当研究人员给 AI 提供所有必要的变量时,它找到了正确的方程。当他们隐藏了一个关键变量时,AI 就变得困惑,并写出了一个简化且错误的定律版本。

3. 黄金组合:用艺术家协助侦探

这是最令人兴奋的部分。研究人员意识到,“直觉艺术家”(Neural ODE)非常擅长平滑处理杂乱的数据,因此它可以充当“侦探”的清洁工

  • 策略:
    1. 获取极少量真实的、带有噪声的数据(仅为通常所需量的 10%)。
    2. 基于这小部分数据训练“艺术家”。
    3. 让“艺术家”根据它学到的知识,生成一个巨大的、干净的、完美的数据集。
    4. 将这个干净的数据集喂给“侦探”。
  • 结果: 尽管“侦探”只看到了 10% 的原始数据(通过艺术家的生成),但它成功找回了三分之二的正确控制方程,并且对第三个方程给出了一个非常接近的猜测。
  • 为什么有效: “艺术家”起到了降噪耳机的作用。它过滤掉了静电干扰,揭示了真实的信号,使得“侦探”更容易找到数学规律。

总结

这篇论文提出了一种在数据匮乏时进行科学研究的新方法:

  1. 使用灵活的 AI(Neural ODE)从一小部分嘈杂的样本中学习系统的“氛围”。
  2. 让该 AI 生成该系统的清晰全貌。
  3. 使用寻找公式的 AI(符号回归)来阅读这张清晰的全貌图,并写下实际的物理定律。

这就像是使用一位熟练的素描画家来填补模糊犯罪现场照片中的缺失细节,以便侦探最终能看清车牌号并破案。这种方法可以成为那些在数据难以获取的领域工作的科学家的强大工具。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →