Physics-constrained symbolic regression for discovering closed-form equations of multimodal water retention curves from experimental data

本文提出了一种物理约束的符号回归框架,通过结合遗传编程与物理约束损失函数,直接从实验数据中自动发现能够准确描述具有多模态孔隙分布多孔材料水 retention 特性的闭式方程。

Yejin Kim, Hyoung Suk Suh

发布于 2026-03-05
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文讲述了一个关于**“教电脑像科学家一样思考”**的故事,目的是为了解决一个非常具体的工程难题:如何准确描述多孔材料(比如土壤、岩石)中水的“脾气”

为了让你轻松理解,我们可以把这篇论文的核心内容拆解成几个生动的场景:

1. 难题:水的“双重性格”

想象一下,土壤就像一块海绵。

  • 普通海绵:孔洞大小差不多,吸水放水的规律很简单,就像一条平滑的滑梯。以前的科学家用的公式(比如范·根uchten 模型)就是专门描述这种“单模态”(只有一种孔洞大小)的海绵。
  • 复杂海绵:但现实中的土壤很复杂,有的地方孔大,有的地方孔小,甚至有的地方像大管子,有的地方像细毛管。这种“多模态”的土壤,水的行为就像过山车,忽上忽下,非常复杂。
  • 旧方法的尴尬:以前遇到这种复杂土壤,工程师们只能把几个简单的公式硬拼在一起(就像把几个不同形状的积木强行粘在一起)。但这需要人工去调每一个积木的参数,既麻烦,又容易出错,而且如果数据很少(比如只有几个测量点),这种拼凑的方法就完全失效了。

2. 新方案:给 AI 装上“物理指南针”

作者提出了一种新方法:物理约束符号回归(PCSR)

我们可以把这个过程想象成**“教一个调皮的孩子(AI)写诗”**:

  • 传统的深度学习(黑盒):就像给孩子一支笔,让他随便写。他可能写得很像样,但你完全不知道他脑子里在想什么(不可解释),而且他可能会写出“太阳从西边升起”这种违背常识的句子(不符合物理规律)。
  • 传统的符号回归(找公式):就像让孩子在成千上万个汉字和符号里,自己组合出一句通顺的诗。这很难,因为组合太多了,而且孩子容易为了押韵(拟合数据)而胡编乱造,写出“虽然逻辑不通但读起来顺口”的句子(过拟合)。
  • 本文的“物理约束符号回归”
    1. 目标:我们要找出一句**既押韵(符合实验数据)又符合物理常识(比如水不能凭空增加,也不能变成负数)**的“诗”(数学公式)。
    2. 方法:我们给 AI 一个**“物理指南针”**(损失函数中的物理约束)。
      • 单调性约束:告诉 AI,“吸力越大,水越少”,这是铁律,不能反着来。
      • 边界约束:告诉 AI,“水最多只能是满的(100%),最少也不能是负的(0%)”。
      • 模式约束:告诉 AI,“这块土壤有 2 种孔洞,所以你的公式曲线应该像有两个波峰的山脉,而不是乱跳的波浪”。

3. 核心魔法:进化与筛选

AI 是如何找到这个完美公式的呢?它用了一种叫**“遗传编程”的方法,就像生物进化**:

  1. 诞生:AI 先随机生成几千个乱七八糟的数学公式(就像生出一堆小猴子)。
  2. 考试
    • 看谁最像实验数据?(数据损失)
    • 看谁违背了物理定律?(物理惩罚:如果水变多了,就狠狠扣分)。
    • 看谁的山峰数量对吗?(模式惩罚:如果目标是双峰,你画出了三峰,就扣分)。
  3. 进化:把得分高的公式“生”出下一代(交叉),并偶尔让它们“变异”一下(修改几个符号)。
  4. 结果:经过几百代的筛选,剩下的就是那个既符合数据、又遵守物理铁律、还能解释清楚的完美公式。

4. 为什么这很重要?

  • 透明化:以前的 AI 模型像个黑盒子,工程师不敢用。现在,AI 吐出来的是一行行看得懂的数学公式,工程师可以直接把它写进工程软件里,就像以前用传统公式一样。
  • 抗干扰:即使实验数据很少,或者数据里有噪音(测量误差),因为有“物理指南针”的约束,AI 也不会被带偏,不会算出“水比石头还重”这种荒谬的结果。
  • 通用性:这个方法不仅能算土壤,未来还能算岩石、混凝土等各种多孔材料。

总结

这就好比,以前我们要描述一种复杂的海绵,只能靠猜或者拼凑;现在,我们给电脑装上了**“物理常识”“形状指南”,让它自己从实验数据中“悟”**出了一条既科学又简洁的数学公式。

一句话概括:这是一项让 AI 在遵守物理铁律的前提下,自动从实验数据中“发明”出简洁数学公式的技术,专门用来解决复杂土壤吸水难预测的痛点。