Data-driven Progressive Discovery of Physical Laws

本文提出了“符号回归链”(CoSR)框架,通过模拟从简单到复杂的渐进式科学发现路径,将物理定律的挖掘建模为具有明确物理意义的知识单元的逻辑组合,从而有效克服了传统端到端符号回归在复杂物理系统中生成冗长无意义表达式的问题,并在多个流体力学及工程问题中成功验证了其改进经典理论与发现新规律的能力。

原作者: Mingkun Xia, Weiwei Zhang

发布于 2026-03-17
📖 1 分钟阅读☕ 轻松阅读

这是对下方论文的AI生成解释。它不是由作者撰写或认可的。如需技术准确性,请参阅原始论文。 阅读完整免责声明

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一种名为**“符号回归链”(CoSR)的新方法,它的核心目标是让计算机像人类科学家一样,一步步地发现物理定律**。

为了让你轻松理解,我们可以把“发现物理定律”想象成**“拼乐高”或者“剥洋葱”**的过程。

1. 以前的方法:试图一口吃成个胖子

传统的符号回归(Symbolic Regression)就像是一个急于求成的厨师

  • 做法:它把一堆食材(数据)扔进锅里,试图一次性炒出一道完美的菜(一个复杂的数学公式)。
  • 问题:因为食材太多、太杂,它炒出来的菜往往是一锅**“大杂烩”**。虽然味道(数据拟合度)可能还行,但没人知道里面到底放了什么,而且这道菜换个地方(新数据)就完全不能吃了。
  • 比喻:这就像试图直接背诵整本《百科全书》来理解世界,而不是先理解“苹果”、“重力”这些基本概念。

2. 新的方法(CoSR):像科学家一样“剥洋葱”

这篇论文提出的 CoSR 方法,模仿了人类科学发现的历史规律:从简单到复杂,层层递进。它不再试图一步到位,而是把发现过程拆成了三个“剥洋葱”的阶段:

第一阶段:去粗取精(无量纲化)

  • 做什么:先把数据里的“单位”去掉。比如,不管你是用“米”还是“英尺”量长度,用“秒”还是“小时”量时间,物理规律本身是不变的。
  • 比喻:就像你在整理一堆不同国家的货币,先把它们都换算成“美元”或者“购买力”,这样大家就站在同一起跑线上了,去掉了无关的干扰项。

第二阶段:层层拆解(分层发现)

  • 做什么:这是 CoSR 最厉害的地方。它不直接找最终答案,而是先找中间变量
    • 它先发现几个简单的“积木块”(比如发现“温度差”和“高度”结合成了一个叫“格拉晓夫数”的东西)。
    • 然后再把这些“积木块”拼在一起,发现更复杂的规律。
  • 比喻:就像搭乐高
    • 传统方法是想直接拼出一艘巨大的飞船。
    • CoSR 是先拼好一个“轮子”,再拼好一个“引擎”,最后把轮子和引擎拼成车,再把车拼成飞船。每一步拼出来的东西都有明确的物理意义(比如“轮子”就是轮子),这样最后拼出来的飞船既结实又好懂。

第三阶段:化繁为简(变换与修正)

  • 做什么:有时候拼出来的公式太复杂,像一团乱麻。CoSR 会尝试用数学技巧(比如取对数、做变换)把复杂的曲线变成简单的直线,或者把几条线合并成一条线。
  • 比喻:就像整理乱糟糟的耳机线。它能把缠绕在一起的线理顺,让你一眼就能看出哪根线连着哪个插头,让规律变得清晰可见。

3. 这个新方法有多牛?(实际应用案例)

论文里用这个方法做了几个很酷的实验,证明了它不仅能“复习”旧知识,还能“发明”新知识:

  • 复习历史(万有引力)
    它完全重演了人类发现万有引力的过程:从开普勒的行星运动定律 \rightarrow 牛顿的圆周运动公式 \rightarrow 最后拼出了万有引力定律。它甚至自动发现了“约化质量”这个人类花了很多年才搞懂的概念。

    • 比喻:就像让一个 AI 重新走了一遍牛顿的路,而且它自己悟出了牛顿当年悟出的道理。
  • 发现新规律(湍流与管道)
    在研究流体(比如水管里的水流)时,以前的公式在不同情况下需要换不同的算式(像拼凑的补丁)。CoSR 发现了一个统一的公式,把原本复杂的“补丁”变成了一个光滑的、统一的规律。

    • 比喻:以前修水管,不同粗细的水管用不同的补丁;现在发现了一个“万能补丁”,不管多粗的水管都能完美贴合。
  • 激光打金属(工业应用)
    在激光切割金属时,不同金属(铝、钛、钢)的表现很难统一预测。CoSR 自动发现了一个新的“材料特征数”,能把这三种金属自然地分类,并大大提高了预测精度。

    • 比喻:就像给不同的金属发了一张“身份证”,以前我们只能凭经验猜,现在 AI 直接算出了它们的“性格特征”,预测起来准得吓人。
  • 飞机设计(空气动力学)
    它帮助科学家找到了不同形状飞机(尖头 vs 圆头)在高速飞行时的阻力规律,发现它们背后的数学结构其实是一样的,只是几个常数不同。

    • 比喻:就像发现不管是跑车还是卡车,虽然长得不同,但空气阻力背后的“驾驶逻辑”是通用的,只是参数微调了一下。

总结

这篇论文的核心思想是:科学发现不是一蹴而就的魔法,而是一个循序渐进的积木搭建过程。

CoSR 就是给计算机装上了一个**“科学家的思维框架”**。它不再盲目地在大海捞针,而是像人类科学家一样:

  1. 先简化(去掉单位干扰);
  2. 再拆解(找出中间的小规律);
  3. 最后组装(把小规律拼成大理论)。

这种方法不仅让计算机算得更准,更重要的是,它算出来的公式人类能看懂,而且能告诉我们为什么是这样。这标志着 AI 从单纯的“数据拟合工具”,正在向真正的“科学发现助手”进化。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →