Modeling and Control of a Pneumatic Soft Robotic Catheter Using Neural Koopman Operators

Each language version is independently generated for its own context, not a direct translation.

这篇论文讲述了一项关于**“如何更聪明地控制软体机器人导管”的研究。为了让你轻松理解，我们可以把这项技术想象成“教一个没有眼睛的盲人在迷宫里精准走路”**。

1. 背景：为什么需要这个？

想象一下，医生要给心脏做手术（比如治疗房颤），需要把一根细细的导管伸进心脏里。

传统方法：医生靠手操作，就像在黑暗中摸索，既累又容易手抖，而且为了看清导管位置，必须一直用 X 光透视，这对病人和医生都有辐射风险。
机器人方法：用机器人代替人手，更稳、更准。但是，这种**“软体机器人导管”**（像橡胶管一样软）非常难控制。它不像机械臂那样硬邦邦、有固定的关节，它一充气就会像面条一样弯曲、扭曲，行为非常不可预测（非线性）。

核心难题：

太软了：很难用传统的数学公式算出它下一秒会弯成什么样。
没眼睛：为了减少辐射，医生不能一直开着 X 光看。这意味着机器人必须**“盲走”**（开环控制），即：输入指令后，它得自己算准能走到哪里，中间不能靠摄像头修正。

2. 核心创新：给机器人装个“超级大脑”

以前的方法要么太简单（假设它像硬杆子一样动，结果不准），要么太复杂（算得太慢，来不及控制）。

这篇论文提出了一种叫**“神经 Koopman 算子”**的新方法。我们可以用两个比喻来理解它：

比喻一：把“乱麻”变成“直线”

原来的世界（非线性）：想象你在玩一个极其复杂的弹珠台，球撞来撞去，路线弯弯曲曲，完全没法预测。这就是软体导管的真实状态。
Koopman 的魔法（升维）：Koopman 算子就像是一个**“魔法眼镜”。戴上这副眼镜，原本弯弯曲曲的弹珠轨迹，在另一个维度（升维空间）里竟然变成了一条笔直的直线**！
神经网络的功劳：以前的“魔法眼镜”是人工设计的，不够灵活，看不清复杂的路线。这篇论文用神经网络自动学习怎么戴这副眼镜。它能自己发现：“哦，原来把气压和位置这样组合看，轨迹就是直的！”

比喻二：翻译官与预测员

这个框架就像一个**“翻译团队”**：

编码器（Encoder）：把导管真实的、复杂的弯曲状态（中文），翻译成那个“直线世界”里的简单坐标（英文）。
Koopman 算子：在“直线世界”里，用简单的加减法预测下一步会发生什么（因为直线好算嘛）。
解码器（Decoder）：把预测出的“英文”结果，再翻译回“中文”，告诉医生导管实际会弯到哪里。

3. 他们做了什么实验？

研究人员做了一个像心脏心房一样的 3D 打印模型，里面有很多弯曲的通道。他们让机器人导管去触碰模型壁上的特定目标点。

任务：机器人要在没有实时 X 光反馈的情况下，仅靠“盲猜”（开环控制），精准地到达目标点并摆正角度。
对比对象：
- NNKM（他们的新方法）：带“超级大脑”的神经 Koopman。
- LNKM：简化版，假设输入是线性的（不够聪明）。
- MBKM：老式的 Koopman，靠人工选公式（太死板）。
- SSM：传统的线性模型（完全不适合软体）。
- PCC：基于几何假设的传统方法（像假设管子是完美的圆弧）。

4. 结果怎么样？

结果非常惊人，就像**“新手司机”变成了“赛车手”**：

精准度：他们的“超级大脑”（NNKM）让导管到达目标点的平均误差只有 2.1 毫米（大概一颗绿豆的大小），角度误差不到 5 度。
对比：其他方法要么误差太大（像 8 毫米，甚至 17 毫米），要么根本走不到目标，要么在目标附近乱晃。
效率：因为算得准，它到达目标的速度也最快，比传统方法快了约 20-30%。

5. 这意味着什么？（总结）

这项研究就像是为软体机器人导管装上了一个**“预知未来的导航仪”**。

以前：医生得一直盯着 X 光屏，小心翼翼地微调，生怕走错。
以后：医生只需要告诉机器人“去那个点”，机器人就能利用这个“超级大脑”自己规划路线，一次性精准到达，大大减少了 X 光的使用，降低了辐射风险。

一句话总结：
这篇论文发明了一种**“用 AI 把复杂的软体运动变简单”**的方法，让机器人导管能在没有眼睛（实时影像）的情况下，像老练的向导一样，精准、快速地穿过复杂的心脏血管，为未来的微创手术带来了更安全、更高效的希望。

Each language version is independently generated for its own context, not a direct translation.

这是一份关于论文《Modeling and Control of a Pneumatic Soft Robotic Catheter Using Neural Koopman Operators》（基于神经 Koopman 算子的气动软体机器人导管建模与控制）的详细技术总结。

1. 研究背景与问题 (Problem)

应用场景：心脏导管介入手术（如房颤消融）需要极高的精度和稳定性。传统的导管操作依赖医生手动技能，而机器人导管系统旨在提高精度和安全性。
核心挑战：
1. 非线性与欠驱动：气动软体机器人导管（PSRC）具有高度非线性和欠驱动特性，传统的基于物理的模型（如 Cosserat 杆模型、有限元法 FEM）计算量大，难以满足实时控制需求；而简化的几何模型（如分段恒定曲率 PCC）难以泛化到复杂的气动系统。
2. 传感限制与开环控制：在临床中，为了减少辐射暴露，X 射线透视（Fluoroscopy）的使用受到严格限制，导致无法获得连续的实时反馈。同时，在微型软体导管中嵌入密集传感器极具挑战。因此，需要开发开环控制策略，即在无连续反馈的情况下，依靠准确的模型预测将导管可靠地引导至目标位姿。
3. 现有数据驱动方法的局限：Koopman 算子理论可以将非线性系统提升到线性空间进行预测控制，但传统方法依赖人工选择基函数（如多项式基），往往无法捕捉复杂的气动行为，导致控制性能下降。

2. 方法论 (Methodology)

论文提出了一种神经 Koopman 算子（Neural Koopman Operator）框架，结合模型预测控制（MPC），实现了端到端的系统建模与开环控制。

A. 神经 Koopman 算子框架

核心思想：利用前馈神经网络（FNN）自动学习“提升空间”（Lifted Space）的表示，将非线性动力学映射为线性演化，而非人工设计基函数。
网络架构：
- 编码器（Encoders）：包含状态编码器 $\Phi^e_x$ $Φ_{x}^{e}$ 和输入编码器 $\Phi^e_u$ $Φ_{u}^{e}$ 。
  - NINK (Nonlinear Input Neural Koopman)：输入编码器同时处理状态 $x_k$ 和输入 $u_k$ ，以非线性方式捕捉输入对系统的影响。
  - LINK (Linear Input Neural Koopman)：输入编码器退化为线性输入，假设输入对系统的影响是线性的（作为对比变体）。
- Koopman 算子矩阵：在提升空间中，系统演化由线性矩阵 $A$ 和 $B$ 描述： $\gamma(x_{k+1}) = A\Phi^e_x(x_k) + B\Phi^e_u(x_k, u_k)$ 。
- 解码器（Decoders）：将提升空间的状态 $\gamma$ 映射回原始物理状态 $x$ 。
训练策略：采用端到端训练，分两步优化：
1. 优化编码器参数以最小化多步预测误差（R-step loss），确保长期演化准确性。
2. 优化解码器参数以最小化状态重构误差。

B. 控制策略：模型预测控制 (MPC)

在提升空间中构建线性 MPC 问题，优化未来的控制输入序列，使预测轨迹逼近目标位姿。
开环执行：由于缺乏实时反馈，控制器计算出一系列最优控制指令（压力值），直接应用于机器人，中间不进行修正。
对比基线：
- MBKM：使用人工选择的多项式基函数的 Koopman 算子 + MPC。
- SSM：原始状态空间下的线性状态空间模型 + MPC。
- PCC：基于分段恒定曲率假设的解析模型 + 雅可比矩阵逆运动学控制（作为传统模型基线）。

3. 关键贡献 (Key Contributions)

数据驱动框架创新：提出了一种结合 Koopman 算子理论与神经网络的框架，在保持提升空间线性结构的同时，通过神经网络自动学习非线性特征，有效捕捉了 PSRC 的复杂动力学。
开环控制实现：将上述框架与 MPC 集成，实现了高精度的开环控制，解决了在缺乏连续成像反馈下导管精准到达目标位姿的难题。
全面的实验验证：在交互式位置控制和模拟心脏消融（心房模型）任务中进行了验证，证明了该方法在精度和效率上均优于传统模型和其他 Koopman 变体。

4. 实验结果 (Results)

实验在双段气动软体导管原型上进行，包含 2586 个输入 - 输出样本。

A. 建模性能

NINK 模型表现最佳：在预测精度（RMSE）和阈值内准确率（Acc）上均优于其他模型。
- 位置预测 RMSE： $x$ 轴 0.6mm, $y$ 轴 1.1mm。
- 角度预测 RMSE：2.2mm。
- 准确率（5% 阈值）： $x$ 轴 90.44%, $y$ 轴 92.12%, 角度 99.73%。
对比分析：
- LINK 表现次之，受限于线性输入假设，无法完全捕捉气动非线性。
- MBKM（人工基函数）和 SSM（线性模型）在预测 $x$ 轴位置时表现较差，导致控制不稳定。

B. 控制性能（交互式位置控制与心房模型消融）

实验 1（位置控制）：
- NNKM (NINK+MPC)：平均误差 0.7 mm，所有目标均在 1.5mm 和 3.5mm 的精度阈值内达到（100% 成功率）。
- 其他方法（LNKM, MBKM, SSM）误差较大，且部分出现振荡或偏离。
实验 2（心房模型姿态控制）：
- NNKM：平均位置误差 2.1 ± 0.4 mm，平均姿态误差 4.9 ± 0.6°。
- 效率：NNKM 达到稳定状态的平均时间比 LNKM 快 8%，比 MBKM 快 24%，比 SSM 快 29%，比 PCC 快 5%。
- 鲁棒性：NNKM 在所有 40 次试验中表现出最低的误差标准差，而 MBKM 和 SSM 在特定目标点误差波动极大。

5. 意义与展望 (Significance)

临床价值：该研究为减少心脏手术中的辐射暴露提供了技术路径。通过高精度的开环控制，医生可以在减少 X 射线透视频率的情况下，依然可靠地将导管引导至消融靶点。
技术突破：证明了神经 Koopman 算子在处理软体机器人高度非线性、欠驱动系统时的优越性，特别是其自动学习提升空间表示的能力，克服了传统方法依赖人工特征工程的瓶颈。
未来方向：
- 评估模型在不同 PSRC 设计上的泛化能力。
- 扩展至全形状建模和受限环境下的运动规划。
- 引入导管 - 组织力估计作为导航约束，进一步提升手术安全性。

总结：该论文提出了一种基于神经 Koopman 算子的先进控制框架，成功解决了气动软体导管在复杂非线性动力学和受限传感条件下的精准开环控制问题，显著提升了心脏介入手术的精度和效率，具有重要的临床应用前景。