A hierarchy of thermodynamics learning frameworks for inelastic constitutive modeling

本文提出了一种统一的学习框架,通过基于不变表示和神经常微分方程的通用架构,在相同条件下系统比较了多种热力学一致的非弹性本构建模方法,从而隔离并评估了热力学结构假设(如对偶性、正交性及凸性)对模型可学习性、表达能力、稳定性及泛化性能的具体影响。

Reese E. Jones, Jan N. Fuhg

发布于 2026-03-04
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文探讨了一个非常有趣的问题:当我们教人工智能(AI)去预测材料(比如金属、塑料、复合材料)在受力时如何变形、断裂或发热时,我们应该给 AI 灌输什么样的“物理世界观”?

想象一下,你正在训练三个不同的学生(代表三种不同的物理理论框架),让他们去预测一个复杂的弹簧或橡皮泥在受到拉扯、挤压和扭转时的反应。虽然他们都要学习同样的数据,但他们脑子里的“底层逻辑”完全不同。

这篇论文就是让这三个学生用完全相同的神经网络架构(也就是相同的“大脑结构”和“学习方法”)去解决同样的问题,然后看看谁学得最好,谁最稳定。

核心比喻:三种不同的“物理世界观”

为了理解这三种框架,我们可以把材料想象成一个复杂的交通系统,而应力(受力)和应变(变形)就是车流

1. 耗散势框架 (DP - Dissipation Potential)

  • 比喻:灵活的“导航员”
    • 这个框架认为,材料内部有一个“能量地图”(自由能),告诉它怎么弹性地回弹;同时还有一个“摩擦地图”(耗散势),告诉它怎么消耗能量(比如变热)。
    • 特点:它非常灵活。只要保证能量不会凭空产生(符合热力学第二定律),它允许“导航员”用各种奇怪的方式去规划路线。它不强制要求“摩擦力”必须严格垂直于“路面”(非关联流动)。
    • 在论文中的表现:在预测复杂的金属合金(AlSi10Mg)时,它表现得最好,因为它足够灵活,能捕捉到材料内部那些突然的、不连续的“急转弯”(比如从弹性突然跳到塑性)。

2. 广义标准材料 (GSM - Generalized Standard Materials)

  • 比喻:严格的“交通法规”
    • 这个框架不仅要有地图,还强制规定:所有的“摩擦力”必须严格垂直于“路面”(正交性/关联流动)。这就像规定所有车在转弯时,必须沿着特定的几何轨迹走,不能随意变道。
    • 特点:结构非常严谨,数学上非常漂亮,能保证物理上的绝对一致性。但这也意味着它太死板了。如果现实世界的材料行为稍微有点“不守规矩”(比如非关联流动),这个框架就学不进去,或者学得很吃力。
    • 在论文中的表现:在预测复杂的合金时,它有点“水土不服”,初期反应有点慢。但在预测那些行为很“规矩”、很均匀的简单材料时,它反而因为约束少、干扰少,表现得稍微好一点点

3. 度量辛结构 (MP - Metriplectic)

  • 比喻:双引擎的“混合动力车”
    • 这个框架把材料的运动分成两半:一半是可逆的(像弹簧一样,能量守恒,由哈密顿算子控制),另一半是不可逆的(像刹车一样,产生热量,由度量算子控制)。
    • 特点:它像一辆混合动力车,把“省油模式”(弹性)和“刹车模式”(耗散)在数学结构上彻底分开。这种结构非常几何化,非常优雅。
    • 在论文中的表现:它的预测精度和其他两个差不多,但它内部产生的“状态变化”(比如内部变量的演化轨迹)看起来和其他两个完全不同。它证明了这种“双引擎”设计是可行的,而且很稳定。

论文做了什么?(实验过程)

研究者没有让这三个学生用不同的“大脑”(神经网络结构)去比,那样就不公平了(因为可能只是某个学生脑子更聪明,而不是他的世界观更好)。

他们做了一个控制变量实验

  1. 统一大脑:给三个学生都装上了同样先进的神经网络(基于不变量表示和神经微分方程)。
  2. 统一教材:用三个不同的高精度模拟数据来训练他们:
    • 铝合金(像复杂的金属,有弹性也有塑性,很难搞)。
    • 玻璃珠硅胶(像橡胶,有粘性,反应速度很重要)。
    • 铁晶粒(像金属晶体,非常复杂,速度依赖性强)。
  3. 统一考试:让他们在没见过的数据上做题。

发现了什么?(结果)

  1. 都能学会:令人惊讶的是,这三种截然不同的“物理世界观”,只要配合强大的神经网络,都能非常准确地预测材料的反应。
  2. 结构决定表现
    • 最灵活的(DP)在处理最复杂、最“调皮”的材料(铝合金)时表现最好。
    • 最严格的(GSM)在处理最复杂材料时稍微有点吃力(因为它被规则束缚住了),但在处理简单、均匀的材料时,反而因为规则清晰,表现略胜一筹。
    • 最优雅的(MP)证明了这种把“可逆”和“不可逆”彻底分开的数学结构也是完全可行的。

结论与启示

这篇论文告诉我们:在训练 AI 做物理预测时,你选择哪种“物理理论”作为底层逻辑,就像给 AI 戴上了一副不同颜色的眼镜。

  • 如果你戴灵活的眼镜(DP),AI 能看清那些复杂的、不规则的细节。
  • 如果你戴严格的眼镜(GSM),AI 会非常守规矩,但在面对复杂情况时可能会显得笨拙。
  • 如果你戴双模眼镜(MP),AI 能清晰地分辨出哪些是弹性变形,哪些是永久损伤。

最终建议:没有一种理论是万能的。未来的方向是设计一种更通用的框架(比如论文最后提到的“隐式标准材料”),既能包含所有这些理论的优点,又能让 AI 自己决定在什么情况下该用哪种“眼镜”,从而既保证物理上的正确性,又能适应千变万化的材料世界。

一句话总结:这篇论文通过让三种不同的物理理论“同场竞技”,证明了物理结构的约束(世界观)会直接影响 AI 的学习能力和预测精度,我们需要根据材料的复杂程度,聪明地选择最适合的“物理世界观”来指导 AI。