Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一种名为 Ex-HiDeNN 的新型人工智能技术。为了让你轻松理解，我们可以把它想象成一位**“超级侦探”，它的任务不是简单地猜答案，而是要从一堆杂乱无章的数据中，找出事物背后简洁、优美且能写进教科书里的数学公式**。

下面我用几个生活中的比喻来拆解它的工作原理和厉害之处：

1. 为什么要发明它？（黑盒 vs. 白盒）

传统 AI（黑盒）： 就像你让一个天才厨师做菜，他做出来的菜很好吃（预测很准），但他拒绝告诉你食谱。你只知道“输入食材 A 和 B，输出美味 C"，但不知道中间发生了什么。这在科学和工程中很危险，因为如果你不知道原理，就无法解释为什么，也无法保证它在没见过的情况下依然安全。
传统符号回归（找公式）： 就像让一个小学生拿着字典去猜公式。如果变量很少，他能猜对；但如果变量有几十个，就像让他在一座巨大的迷宫里找一根针，效率极低，而且容易猜错。
Ex-HiDeNN（超级侦探）： 它结合了前两者的优点。它先派一个“观察员”（神经网络）去快速摸清数据的整体规律，然后派一个“分析师”（符号回归）去把规律提炼成简洁的公式。

2. 它是如何工作的？（三步走策略）

Ex-HiDeNN 的工作流程就像是一个**“先画地图，再找捷径”**的过程：

第一步：画一张高精度的“地形图” (C-HiDeNN-TD)

面对一堆杂乱的数据，Ex-HiDeNN 首先训练一个特殊的神经网络。

比喻： 想象你要描述一座复杂山脉的地形。传统的 AI 只是把每个点的高度记下来（黑盒）。Ex-HiDeNN 则像一位测绘员，它利用一种叫“张量分解”的技术，把这座大山拆解成几个简单的方向（比如：东西走向的坡度、南北走向的坡度）。
作用： 它生成了一张连续且平滑的“地形图”（代理模型）。这张图不仅能完美拟合数据，还能让我们随时计算任何一点的“坡度”（导数），这是后续步骤的关键。

第二步：检查“地形”是否好走 (可分离性检查)

拿到地图后，Ex-HiDeNN 会做一个“体检”，看看这些数据是**“各自为政”还是“纠缠不清”**。

比喻：
- 情况 A（好走）： 如果山脉的走向是独立的（比如东边的坡度只跟东边有关，跟西边无关），这叫“可分离”。这时候，侦探可以**“分而治之”**，分别找出东边和西边的简单公式，最后乘起来就行。
- 情况 B（难走）： 如果山脉是乱成一团的（东边的坡度受西边影响很大），这叫“强耦合”。这时候就不能分开了，需要整体分析。
技术点： 它通过计算“海森矩阵”（一种数学工具，用来描述曲率）来判断这种关系。

第三步：提取“终极公式” (符号回归)

根据第二步的检查结果，Ex-HiDeNN 决定怎么找公式：

如果数据很简单（可分离）： 它把大问题拆成几个小问题，分别用符号回归（PySR）去找每个小部分的公式，最后拼起来。这就像把一道复杂的菜拆成“炒肉”和“煮汤”两个简单步骤，分别写食谱，最后合起来。
如果数据很复杂（不可分离）： 它利用第一步画好的“高精度地图”进行智能采样，避开噪音，直接让符号回归引擎去挖掘整体公式。

3. 它有多厉害？（实战案例）

论文展示了它在三个工程领域的“破案”能力：

预测金属疲劳（找寿命公式）：
- 背景： 3D 打印的钢材，有 25 种化学成分和工艺参数，数据非常少且稀疏。
- 成果： 传统方法很难处理。Ex-HiDeNN 成功找出了一个包含对数、正弦和指数函数的简洁公式。
- 比喻： 就像从 25 种复杂的调料中，精准地提炼出决定味道的那几个关键配方，而且预测结果和实验数据几乎完美重合。
预测材料硬度（找硬度公式）：
- 背景： 通过微观压痕数据预测材料的硬度。
- 成果： 它的预测误差比之前的顶尖方法（SISSO）低了25 倍！
- 比喻： 以前猜硬度像是在雾里看花，现在 Ex-HiDeNN 就像给雾里装了探照灯，看得清清楚楚，几乎零误差。
发现物理定律（找屈服面公式）：
- 背景： 描述土壤或岩石在压力下何时会变形（屈服）。
- 成果： 它直接从数据中“复活”了经典的 Matsuoka-Nakai 屈服准则，甚至推导出了新的数学表达。
- 比喻： 就像给科学家提供了一把钥匙，直接从数据中打开了物理世界的大门，找回了那些被遗忘或未被发现的物理定律。

4. 总结：为什么这很重要？

透明： 它给出的不是“黑盒”预测，而是人类能读懂的数学公式。工程师可以检查公式里的每一项，看看是否符合物理常识。
高效： 它解决了传统找公式方法在变量多时“算不动”的问题，通过“先拆解再组合”的策略，极大地提高了效率。
抗噪： 即使数据里有噪音（比如测量误差），它也能通过平滑的“地形图”过滤掉干扰，找到真正的规律。

一句话总结：
Ex-HiDeNN 就像一位既懂深度学习又懂数学的“翻译官”，它把机器眼中杂乱无章的数据，翻译成了人类科学家能理解、能信任、能直接用于工程设计的简洁公式。这让 AI 从“只会猜谜的算命先生”变成了“能写教科书的科学家”。

Each language version is independently generated for its own context, not a direct translation.

可解释分层深度学习神经网络 (Ex-HiDeNN) 技术总结

1. 研究背景与问题 (Problem)

在工程科学和复杂系统中，输入与输出之间的关系通常高度非线性且复杂，难以用简单的解析形式（如线性回归或广义加性模型）准确描述。虽然现代深度学习模型（如 MLP、CNN、GNN）具有强大的预测能力，但它们通常被视为“黑盒”，缺乏可解释性，这在航空航天、医疗等安全关键领域（如 NASA 和 FAA 的指导原则所强调）是一个重大障碍。

另一方面，传统的符号回归（Symbolic Regression）旨在从数据中直接发现封闭形式的数学表达式（白盒模型），具有高度的可解释性和物理一致性。然而，符号回归面临以下核心挑战：

计算复杂性：寻找最优符号形式是一个 NP-hard 问题，随着变量和算子数量的增加，搜索空间呈指数级爆炸。
高维与噪声：在高维数据或含噪数据上，符号回归容易过拟合或无法收敛到简单的解析解。
一致性与可扩展性：现有方法在处理高维耦合系统时往往表现不佳，难以保证结果的复现性。

核心问题：如何构建一种既能保持深度学习的高表达力和准确性，又能像符号回归一样提供清晰、可解释的封闭形式数学表达，且能高效处理高维、稀疏及含噪数据的混合框架？

2. 方法论 (Methodology)

本文提出了一种名为 Ex-HiDeNN (Explainable Hierarchical Deep Learning Neural Networks) 的新型混合架构。该方法采用两阶段流水线，将可微分的结构化代理模型与符号回归相结合，并引入可分性度量来自适应地调整策略。

2.1 核心组件

C-HiDeNN-TD (可微分层深度学习神经网络 - 张量分解版)：
- 作为第一阶段，利用张量分解（Tensor Decomposition）将高维函数空间分解为多个一维子空间。
- 构建一个连续可微的插值代理模型，能够精确拟合数据并计算高阶导数。
- 其结构基于 HiDeNN 和卷积 HiDeNN，具有可解释的节点和补丁函数（Patch Functions）。
海森矩阵可分性度量 (Hessian Separability Measure, $S^\otimes$ )：
- 利用 C-HiDeNN-TD 的自动微分能力计算目标函数的海森矩阵（Hessian Matrix）。
- 通过计算对数绝对值函数的海森矩阵对角项与全矩阵的 Frobenius 范数之比，量化数据的乘法可分性（Multiplicative Separability）。
- 得分 $S^\otimes \in [0, 1]$ ：接近 1 表示高度可分（可分解为单变量函数的乘积），接近 0 表示强耦合。
符号回归引擎 (PySR)：
- 作为第二阶段，使用基于进化算法的 PySR 库从采样数据中恢复封闭形式表达式。
- 利用第一阶段代理模型生成的平滑数据进行采样，而非原始含噪数据，从而过滤噪声。

2.2 自适应两阶段流程

Ex-HiDeNN 根据计算出的可分性得分 $S^\otimes$ 动态调整采样和回归策略：

高可分性 ( $S^\otimes \gtrsim 0.95$ )：采用单模态乘积形式。对每个维度单独采样并拟合单变量表达式，最后相乘。这将指数级的搜索空间降为线性。
中等可分性 ( $0.6 \lesssim S^\otimes \lesssim 0.95$ )：采用多模态求和形式（类似张量分解）。对每个模态的每个维度进行采样，构建“乘积项之和”的表达式。
低可分性 ( $S^\otimes \lesssim 0.6$ )：采用全局采样。直接在代理模型上进行拉丁超立方采样（LHS）和局部扰动采样（LPS），进行全维度的符号回归。

3. 主要贡献 (Key Contributions)

点式海森可分性评分：提出了基于 C-HiDeNN-TD 代理模型自动微分的点式海森可分性评分 $S^\otimes$ ，用于量化数据的内在结构。
新型两阶段 AI 框架：构建了将连续可微的结构化代理模型（C-HiDeNN-TD）与符号回归（PySR）无缝集成的框架，实现了从数据到封闭形式表达式的自动化提取。
全面验证：在合成基准测试和真实工程数据集上进行了广泛验证，证明了其在精度、可解释性和效率上优于传统符号回归和纯神经网络方法。
工程应用突破：成功从数据中发现了三个具有物理意义的新型封闭形式模型：
- 增材制造钢的疲劳寿命方程。
- 基于微压痕数据的材料硬度方程。
- 压力敏感 Matsuoka-Nakai 材料的屈服面表达式。

4. 实验结果 (Results)

4.1 基准测试 (Benchmark Problems)

精度：在 Vladislavleva 等人提出的 8 个标准符号回归基准测试中，Ex-HiDeNN 在大多数情况下（特别是高维和可分函数）恢复了精确的函数形式，其均方根误差（RMSE）比参考方法（如 KAN、PySR 单独使用）低几个数量级。
抗噪性：在添加不同水平高斯噪声（ $\sigma$ 从 0.01 到 0.32）的测试中，Ex-HiDeNN 的 RMSE 比单独使用 PySR 降低了 2 到 10 倍，证明了其通过插值代理模型有效过滤噪声的能力。
动力学系统发现：成功从时间序列数据中恢复了洛伦兹系统（Lorenz system）的控制方程，系数精度达到两位有效数字。

4.2 工程应用

增材制造合金疲劳寿命：
- 处理了包含 25 个输入参数、仅 437 个样本的极度稀疏数据集。
- 发现了一个包含对数、正弦和指数项的封闭形式方程。
- 结果：测试集 $R^2 = 0.9767$ ，相对误差 2.8%。模型揭示了碳、铬等元素对疲劳寿命的非线性影响，符合冶金学原理。
微压痕硬度预测：
- 基于 6 个材料参数预测维氏硬度。
- 结果：与文献中的 SISSO 方法相比，Ex-HiDeNN 的 RMSE 降低了 25 倍（0.066 GPa vs 1.66 GPa），测试集 $R^2 = 0.9999$ ，实现了近乎完美的拟合。
Matsuoka-Nakai 屈服面：
- 从 13,200 个数据点中学习压力敏感材料的屈服准则。
- 结果：恢复的表达式在物理上具有合理性（包含洛德角依赖项），测试集相对误差仅为 2.3%。

5. 意义与局限性 (Significance & Limitations)

意义

可解释性与精度的平衡：Ex-HiDeNN 打破了“黑盒”与“白盒”的界限，提供了既准确又可解释的模型，满足了安全关键领域对 AI 透明度的需求。
解决高维难题：通过可分性度量和分层采样策略，有效缓解了符号回归在高维空间中的组合爆炸问题。
物理发现工具：能够从实验数据中直接推导出符合物理机制的解析方程，加速了新材料本构模型和失效准则的发现过程。

局限性与未来方向

对代理模型的依赖：最终表达式的准确性高度依赖于第一阶段 C-HiDeNN-TD 的拟合质量。如果代理模型未能捕捉底层函数，符号回归将失败。
符号回归的固有挑战：符号回归本身是 NP-hard 问题，且依赖预定义的算子字典。如果字典中缺少关键算子（如 V6 基准测试中的三角函数），则无法恢复正确形式。
低可分性数据：虽然策略包含了对低可分性数据的处理，但在强耦合高维系统中，扩展性仍面临挑战。
未来工作：计划引入 KHRONOS 等更先进的核基神经网络作为代理模型，并探索基于梯度的符号回归方法，以利用代理模型的连续可微特性。

总结：Ex-HiDeNN 代表了一种从数据驱动向“可解释科学发现”转变的重要进展，为复杂工程系统的建模提供了强有力的新工具。

Explainable Hierarchical Deep Learning Neural Networks (Ex-HiDeNN)