LeanBET: Formally-verified surface area calculations in Lean

想象一下，你正在试图测量一块海绵的表面积，但这块海绵是由无数不可见的微孔构成的。科学家们使用一种名为BET（以三位科学家的名字命名）的方法来估算这一面积，其原理是观察气体如何附着在海绵上。这是化学领域的一种标准工具，但有点像是在试图拼凑一幅盒盖图案模糊的拼图。

问题在于：为了得出答案，科学家们必须从实验数据中选取特定范围的数据点，并穿过这些点画出一条直线。问题在于，不同的人（或不同的计算机程序）可能会选取略有不同的范围。一个人可能会说：“让我们使用中间的 10 个点，”而另一个人则说：“不，使用中间的 12 个点。”这导致对同一块海绵得出不同的答案，从而引发困惑，并削弱了对结果的信任。

为了解决这个问题，一个团队开发了一款名为BETSI的计算机程序，它能够自动检查所有可能的数据范围，以找到“最佳”范围。这就像拥有一个机器人，它会尝试拼图块的所有可能组合，以找到完美契合的那一种。然而，即使是机器人也可能存在漏洞，或包含某些隐藏的假设，使其以微妙的方式出错。

登场：“LeanBET"——经过数学证明的机器人

本文的作者们使用一种名为Lean 4的特殊计算机工具，构建了这款机器人的新版本。请将 Lean 4 不仅仅视为一种编程语言，而是一位极其严格的数学老师，它绝不允许你在没有证明的情况下犯错。

以下是他们是如何做到的，通过一些简单的类比：

1. “双脑”系统（多态性）

通常，当你编写计算机程序时，你会使用“浮点数”（就像计算器上的数字）。这些数字运算速度快，但略有瑕疵，因为计算机无法保持无限的精度。而在进行数学证明时，你使用的是“实数”（完美、无限精度），但这些无法在计算机上直接运行。

作者们通过构建一个变形机器人解决了这一问题。

大脑 A（证明）： 当他们需要证明数学正确性时，机器人穿上“实数”套装。它进行完美、理论化的数学运算，以证明逻辑无懈可击。
大脑 B（执行）： 当他们需要在真实数据上运行程序时，机器人切换为“浮点数”套装。它在实际计算机上快速运行。
神奇之处： 由于机器人在两套套装中的构建方式完全相同，如果“证明大脑”确认逻辑完美，那么“执行大脑”就保证遵循相同的规则。这就像用完美的数学证明桥梁设计是安全的，然后用真实的钢材建造实际的桥梁，确信该设计能够经受住考验。

2. “食谱与烹饪”（推导即规范）

在常规科学中，你在纸上写下食谱（数学理论），然后由一位厨师（程序员）在厨房（软件）中尝试烹饪。有时，厨师会在这里或那里多加一撮盐，或者误解某一步骤，导致菜肴的味道与食谱不符。

在LeanBET中，食谱和烹饪发生在同一个房间里。“数学推导”（食谱）被直接写入代码中。计算机检查代码就是食谱本身。如果代码说“加盐”，数学证明就会验证“加盐”正是理论所要求的。理论与实践中不存在任何鸿沟。

3. “严格检查员”（形式化验证）

该论文声称，他们的程序不仅仅是猜测答案，而是随身携带一份正确性证书。

标准软件： 你运行程序，它给出一个数字，你希望它是正确的。
LeanBET： 你运行程序，它给出一个数字，同时还递给你一份经过数学证明的文件，上面写着：“我检查了每一步，遵循了每一条规则，这个数字是基于你提供的数据得出的唯一正确答案。”

他们发现了什么？

他们使用 19 组不同的数据（就像 19 块不同的海绵）测试了他们新的“数学证明机器人”与旧的“标准机器人”（BETSI）。

结果： 在 19 块海绵中，有 18 块的两个机器人给出的答案完全一致，精确到最小的小数位。
唯一的小故障： 对于一块海绵（称为 UiO-66），存在微小的差异（0.03%）。作者承认他们目前尚不确定原因，但相对于实验中通常存在的噪声而言，这是一个非常小的误差。

核心结论

这篇论文并非关于发明一种测量海绵的新方法，而是关于构建现有方法的可信版本。他们将一种标准的科学工具在“数学证明”环境中重新构建，并证明其效果与旧工具一样好，同时保证没有犯任何逻辑错误。

这就像从普通地图升级到 GPS，它不仅告诉你路线，而且逐步证明该路线是可能最短且最安全的，没有任何隐藏的绕行。

"LeanBET：Lean 中形式化验证的比表面积计算"的技术摘要

问题陈述
Brunauer–Emmett–Teller (BET) 方法是基于气体吸附等温线估算比表面积的标准框架。然而，实际实施涉及显著的主观性，特别是在选择用于线性回归的相对压力范围时。尽管存在一致性判据（Rouquerol 判据）以筛选有效区域，但多个压力区间往往能满足这些规则，导致不同实验室和软件实现报告的比表面积存在差异。此前标准化该过程的尝试，如 BET 表面识别（BETSI）算法，依赖于通用数值软件（Python）。虽然 BETSI 通过穷举枚举减少了主观性，但它仍是一种数值算法，其隐藏的实现假设或细微错误无法被形式化排除，导致输出结果的科学保证未经验证。

方法论
作者提出了 LeanBET，这是一个完全可执行且在 Lean 4 定理证明器中形式化验证的 BET 分析流程。该方法将可执行代码与数学证明集成于单一环境中，利用 多态数值设计 弥合计算与验证之间的鸿沟：

多态性：算法使用受 BETLike 类型类约束的泛型类型 α 编写。这使得相同的代码结构既可在 浮点数 (Float) 上实例化以高效处理真实实验数据，也可在实数 (Real) 上实例化以进行不可计算的数学证明。
推导即规范：BET 线性化方程的代数推导不仅是动机，更充当了形式化规范。代码构建旨在镜像这一推导过程，确保可执行的转换与理论模型相匹配。
工作流程：该流程执行以下步骤，每一步均配有形式化证明：
1. 窗口枚举：系统生成包含至少两个数据点的所有连续子列表（等温线片段）。
2. 线性化：将数据点 $(p, n)$ 转换为线性化 BET 形式 $p/[n(1-p)]$ 。
3. 线性回归：对每个窗口执行最小二乘回归，提取斜率、截距和 $R^2$ 。
4. 可接受性检查：基于 Rouquerol 判据（ $n(1-p)$ 的单调性、参数 $C$ 和 $n_m$ 的正性以及单层压力的自洽性）筛选候选项。
5. 拐点选择：通过选择具有最大结束索引的有效窗口来解决有效窗口间的平局，若仍有平局则选择百分比误差最小的窗口。

主要贡献

BETSI 流程的形式化验证：本文提供了首个经过机器检查的完整 BETSI 工作流实现。它证明了可执行代码满足 BET 理论的数学定义及特定选择判据。
可靠性与完备性证明：作者形式化证明了：
- 定理 A.1 与 A.2：BET 等温线方程源自层模型假设，且线性化步骤在代数上是正确的。
- 定理 A.3：窗口枚举是 可靠的（仅生成有效窗口）且 完备的（未遗漏任何有效连续窗口）。
- 定理 A.4 与 A.5：回归步骤返回真实的最小二乘极小值，且提取的物理参数（ $n_m$ , $C$ ）与其理论定义一致。
- 定理 A.6 与 A.7：可接受性检查及基于拐点的选择策略严格满足其形式化规范。
多态实现：该工作展示了 Lean 中科学计算的一种实用模式，即在理想化实数上证明正确性的同时，在浮点运算上执行，从而避免了使用单独的验证语言。

结果
LeanBET 实现使用包含 19 个吸附等温线的基准数据集，与基于 Python 的 BETSI 参考实现进行了评估。

数值一致性：对于 19 个等温线中的 18 个，LeanBET 与 BETSI 参考实现达到了 机器精度 的一致性。
差异：对于 UiO-66 数据集，观察到约 0.03%（0.36 m²/g）的偏差。作者指出，该特定偏差的原因尚不确定，但强调其显著小于典型的实验不确定度。
验证状态：所有证明均成功编译，提供了机器检查的保证，确认算法输出符合指定的数学约束。

意义
本文主张，LeanBET 证明了可以在定理证明器中构建实用的科学计算工作流，而不会牺牲与既定参考实现的数值一致性。其主要贡献并非新算法，而是 形式化验证的正确性保证。通过将可执行流程与机器检查的数学陈述相链接，该工作通过消除关于实现是否遵循底层理论及选择判据的歧义，解决了 BET 分析中的可重复性危机。作者将此定位为迈向弥合材料科学中理论推导与软件实现之间鸿沟的一步。