Each language version is independently generated for its own context, not a direct translation.

想象一下，你正试图将一堆沙子从一个地点移动到另一个地点，但地面并非平坦。也许它是一个球体、一个扭曲的结，或者像马鞍一样的曲面。在现实世界中，数据往往存在于这些曲面上（例如机械臂的旋转或分子的形状），而非平坦的网格状纸张上。

本文介绍了一种名为**熵 RNOT（Entropic RNOT）**的新工具，旨在高效且精确地解决在这些曲面上移动“数据沙”的问题。

以下是他们所做工作的分解，使用了简单的类比：

1. 问题：平面地图与弯曲地球

大多数计算机程序假设世界是平坦的（欧几里得空间）。如果你试图在平面地图上绘制球体上两点之间的直线，距离和方向就会发生扭曲。

问题所在： 当数据存在于弯曲形状（如球体或旋转群）上时，标准的数学技巧就会失效。它们要么算错距离，要么需要耗费巨大的计算能力来求解，以至于对大型数据集变得毫无用处。
旧解决方案：
- 方法 A： 将曲线展平，进行计算，然后再折叠回去。这会引入误差（就像试图在不撕裂的情况下将橘子皮展平）。
- 方法 B： 为每一粒沙子单独计算完美路径。这极其精确，但耗时极长（就像为城市交通拥堵中的每一辆车单独计算路线）。

2. 解决方案：熵 RNOT

作者创造了一个“智能向导”（一种神经网络），它学习如何在这些曲面上移动数据，而无需展平曲面或单独计算每一条路径。

可以这样理解：

“熵”部分（模糊透镜）： 该方法不再要求为每一粒沙子指定单一、完美且僵化的路径，而是允许存在一点“模糊”或随机性。想象一下，你要从 A 点前往 B 点，但你不是走一条严格的路，而是拥有一团可能的路径云。这种“模糊”使得数学求解变得更容易、更快速，就像处理模糊照片比处理高清照片更容易一样。
“神经”部分（学习向导）： 他们训练一个神经网络（一种人工智能）来学习解决方案的“形状”，而不是每次有新数据时都从头开始求解数学问题。一旦训练完成，该网络就能立即告诉你任何新数据（甚至是它从未见过的数据）应该移动到哪里。这被称为摊销（amortization）——你在训练期间支付一次计算成本，之后这个“向导”就可以免费工作了。

3. 工作原理：“热量”与“中心”

本文描述了两种巧妙的方法，将可能的路径“模糊云”转化为具体的答案：

“重心”（重心投影）： 如果你处于像球体这样的曲面上（Cartan-Hadamard 流形），该方法会找到模糊云的“重心”。这就像在问：“如果所有这些可能的路径都是人，当他们手拉手找到平均位置时，他们会站在哪里？”这给出了一个单一、清晰的目标。
“热平滑”（热平滑代理）： 对于更复杂的形状，他们使用了一个称为“热”的概念。想象将一滴墨水（数据）滴入水中。起初，它是一个清晰的点。随着时间推移（热时间），它扩散成一片平滑的云。该方法利用这种扩散效应，将尖锐、锯齿状的数据点转化为平滑、流动分布。这使得数据更易于处理，并防止数学计算在微小的噪声细节上卡住。

4. 他们证明了什么

作者并非凭空猜测；他们从数学上证明了：

如果给予足够的训练，他们的“智能向导”可以学习到完美的解决方案。
随着训练的改进，“重心”方法会越来越接近真实答案。
即使将“热”（随机性）调低，“热平滑”方法也是稳定的，不会引入奇怪的偏差。

5. 现实世界测试：修复蛋白质对接

为了证明其有效性，他们在非常具体且真实的**蛋白质 - 配体对接（Protein-Ligand Docking）**问题上进行了测试。

场景： 想象一把钥匙（药物分子）试图插入一把锁（蛋白质）。计算机试图猜测钥匙如何契合，但它们经常对方向判断稍有偏差。
测试： 他们利用其他软件生成的数千个“错误”猜测，并使用他们的熵 RNOT 对其进行“优化”。
结果： 该方法成功地将药物分子推向了正确的位置，效果远优于之前的方法。它将误差从较大的距离（11.24 Å）减少到了非常小且准确的距离（3.47 Å）。关键在于，这是无需为每个药物分子单独重新计算数学公式而实现的；训练好的“向导”直接应用了它学到的规则。

总结

本文提出了一种在曲面上移动数据的新方法，其特点如下：

准确： 它尊重数据的真实几何结构（无需展平）。
快速： 它学习一个可重用的模型，因此无需为每个新数据点重新求解数学问题。
稳定： 它利用“模糊”和“热”的概念，使数学计算更加稳健且易于计算。

他们从数学上证明了其有效性，并通过修复药物分子的方向展示了其在实践中的可行性，使其成为处理复杂曲面数据时机器学习的一个强大工具。

Each language version is independently generated for its own context, not a direct translation.

技术摘要：熵黎曼神经最优传输

1. 问题陈述

许多机器学习应用涉及支持在弯曲空间（黎曼流形）上的数据，例如球面（ $S^2$ ）、旋转群（$SO(3) $）、刚性位姿（$ SE(3) $）以及对称正定矩阵（$ SPD$）。在这些设定下，标准的欧几里得近似会扭曲距离、平均值以及由此产生的最优传输（OT）问题。

现有方法面临一种权衡：

流形 OT 方法通常追求摊销式的、样本外的传输映射，但遭受计算瓶颈的困扰，经常需要为每个新实例进行迭代式的内部优化。
熵正则化（例如 Sinkhorn 迭代）使离散 OT 具有可扩展性和数值稳定性，但本质上并未提供摊销模型；每对新的分布通常都需要求解一个新的优化问题。

本文旨在解决在可能非紧致的黎曼流形上，结合内蕴几何 OT、摊销式样本外评估与熵正则化之间的空白。

2. 方法论：熵 RNOT

作者提出了熵黎曼神经最优传输（Entropic RNOT），这是一个统一的框架，用于学习可重用的、感知流形的传输模型。

核心公式

该方法基于熵 OT 的半对偶公式。模型不是直接学习传输映射，而是学习目标侧薛定谔势 $g_\theta$ 。

参数化：势函数通过神经拉回进行参数化。连续特征映射 $\phi: K_\nu \to \mathbb{R}^n$ （其中 $K_\nu$ 是目标分布的支撑集）将流形点映射到欧几里得空间。欧几里得神经网络 $a_\theta$ 与 $\phi$ 复合，形成假设类。
中心化：由于薛定谔势仅在加法常数范围内可识别，模型使用中心化的拉回类 $C_\nu(\phi^* \mathcal{F})$ 以确保唯一性。
优化：模型通过在 minibatch 上使用随机梯度上升最大化半对偶目标 $J_\varepsilon(g_\theta)$ 进行训练。源侧势 $f^\varepsilon_\theta$ 通过所学目标势的软 $c$ -变换（一种 log-sum-exp 运算）恢复。

内蕴传输代理

一旦由所学势函数诱导吉布斯耦合 $\pi^\varepsilon_\theta$ ，本文便提取适用于不同流形几何的确定性传输代理：

重心投影：在Cartan–Hadamard 流形（完备、单连通、非正曲率）上，条件律通过黎曼重心（Fréchet 均值）定义确定性传输映射。
热平滑代理：在完备随机完备流形（一个更广泛的类别，包括紧致流形、欧几里得空间以及如 $SE(3)$ 的乘积空间）上，该方法对条件目标律应用热平滑。这将可能具有原子性的条件分布（来自有限样本）转换为绝对连续分布。随后从该平滑密度中导出点预测（众数）。

3. 主要贡献

本文做出了三项主要贡献：

框架引入：Entropic RNOT 是首个用于黎曼流形上静态熵 OT 的内蕴神经框架，它将半对偶公式与摊销式样本外评估相结合。
理论保证：对于固定的正则化参数 $\varepsilon > 0$ $ε > 0$ ，作者证明了所提出的假设类可以在强概率度量（KL 散度、总变差、弱收敛）下恢复熵最优耦合。因此：
- 重心代理在 Cartan–Hadamard 流形上在 $L^2(\mu)$ 中收敛。
- 热平滑代理在任意固定热时间 $t > 0$ 下是稳定的，并且当 $t \to 0$ 时渐近无偏。
- 这些保证适用于可能非紧致流形上具有紧致支撑的数据。
实证验证：该方法在多种几何结构（ $S^2, SO(3), SPD(3), SE(3), H^2$ ）上展示了强大的传输质量，优于环境欧几里得、切空间和对数欧几里得基线。与离散流形 Sinkhorn 相比，其在内存和时间方面具有可扩展性优势，并在真实的蛋白质 - 配体对接应用中取得了显著改进。

4. 实验结果

合成基准

在 $S^2, SO(3), SPD(3), SE(3)$ 和 $H^2$ 上使用包裹正态分布进行评估。

准确性：Entropic RNOT 始终比所有基线更准确地恢复离散流形 Sinkhorn 参考计划，在 $SPD(3) $、$ SE(3) $和$ H^2$ 上观察到最大增益，这些情况下内蕴几何最为关键。
指标：与环境和欧几里得及切空间线性化方法相比，它实现了显著更低的计划 KL 散度和端点测地线误差。

可扩展性

复杂度：离散流形 Sinkhorn 需要 $O(N^2)$ 的内存占用来存储代价矩阵，对于大的支撑集大小（例如 $N=32,768$ ）变得不可行。
性能：Entropic RNOT 的训练时间和内存使用量相对于支撑集大小 $N$ 保持恒定（仅取决于 batch size）。推理吞吐量随 $N$ 线性扩展，能够每秒处理数百万个样本。

现实世界应用：蛋白质 - 配体对接

该方法被应用于使用 CrossDocked2020 数据集细化 $SE(3)$ 上的刚性位姿，以进行蛋白质 - 配体对接。

设置：在混合复合物上训练单个模型，以将保留的对接位姿细化至对接引擎排名最高的结合盆地。训练或推理过程中未使用晶体结构。
结果：
- 将 top-1 RMSD 从 11.24 Å（无细化）降低至 3.47 Å。
- 将 2 Å 范围内的成功率从 10.3% 提升至 75.9%。
- 优于基于物理的极小化方法（GNINA）和每个实例的离散 Sinkhorn（后者由于每个复合物的目标集过小而失败）。

5. 意义与局限性

意义：
本文声称提供了首个内蕴神经框架，将熵正则化的可扩展性与流形上摊销神经 OT 的泛化能力统一起来。它为离散方法在计算上不可行的高维、非欧几里得传输任务提供了一种实用解决方案。

局限性（作者所述）：

理论范围：理论保证针对固定的 $\varepsilon > 0$ 和紧致支撑建立；未解决消失正则化机制（ $\varepsilon \to 0$ ）。
几何约束：重心映射恢复保证需要 Cartan–Hadamard 设定；在此之外，重心可能不唯一或不稳定。
应用特异性：在对接实验中，该方法作为现有位姿集合的细化/去噪程序，而非从头生成的模型。它目前忽略受体口袋上下文，并将配体视为刚性体，忽略了扭转柔性。
计算依赖：性能依赖于高效的测地线距离评估和稳定的 log-sum-exp 计算。

Entropic Riemannian Neural Optimal Transport