Constrained finite-time stabilization by model predictive control: an infinite control horizon framework

Each language version is independently generated for its own context, not a direct translation.

这篇论文提出了一种新的**“智能导航系统”（模型预测控制，MPC），专门用来控制那些有各种限制（比如不能超速、不能撞墙）的机器或系统，并且要求它能在有限的时间内**精准地停在目标点（原点），而不是慢慢悠悠地靠近。

为了让你更容易理解，我们可以把控制一个系统想象成**“驾驶一辆赛车在复杂的赛道上，必须在规定的步数内精准停进停车位”**。

1. 以前的“老司机”遇到了什么麻烦？

在以前的方法里，为了让赛车快速停进车位，工程师们通常采用两种策略，但都有明显的缺点：

策略一：死命令（终端等式约束）
就像教练在起跑线上就规定：“你必须在第 10 步正好停在车位正中心，一步都不能差！”
- 缺点：如果赛车起步位置稍微偏了一点，或者赛道有点滑，这个“死命令”就完不成了。赛车根本不敢起步，因为一旦起步就注定违规。这导致能开车的起始位置非常少（初始可行性低）。
策略二：短视的冲刺（短控制视野）
教练只盯着眼前几步看：“只要你能在 3 步内冲进那个‘一步到位区’，剩下的事再说。”
- 缺点：为了冲进那个小区域，赛车必须猛打方向盘、急刹车（高增益控制）。这很容易导致赛车冲出赛道（违反约束），或者在还没进区域前就失控了。而且，一旦进了那个小区域，还需要切换成另一种驾驶模式（切换策略），逻辑很复杂。

2. 这篇论文提出了什么新招数？

这篇论文的作者设计了一种**“无限视野的长远规划法”**。

核心创意：把“终点”拉得无限远
以前的方法只盯着终点线（或者终点前的一小段）。这篇论文说：“别只盯着终点，我们要把从第 N 步开始直到永远的行驶成本都算进去！”
- 比喻：想象你在开车。以前的方法只计算“最后 3 秒”怎么停。新方法说：“我们要计算从第 5 秒开始，一直到永远，你开车的油耗和舒适度总和。”
- 神奇之处：虽然我们要算“永远”，但在数学上，这可以巧妙地转化为一个有限步数的计算问题（就像虽然我们要规划一辈子，但只需要算好未来 8 年的详细计划，剩下的自动按规律走）。

3. 这个方法好在哪里？（三大优势）

A. 起点更自由（扩大了初始可行域）

比喻：以前的方法要求你必须在“停车位正前方 1 米”才能开始倒车。现在的方法说：“只要你在整个停车场范围内，我都能规划出一条路，让你最终停进去。”
结果：赛车可以从更远的地方、更偏的位置开始，依然能稳稳停进车位。这大大增加了系统的实用性。

B. 不需要“急刹车”或“换模式”

比喻：以前的方法为了快速停车，经常需要猛踩刹车（违反约束风险大），或者在快到终点时突然切换成“自动驾驶模式”。
结果：新方法通过长远的规划，让赛车平滑地减速，既没有急刹车的危险，也不需要中途切换模式。整个过程一气呵成，逻辑简单。

C. 既快又稳（有限时间稳定）

比喻：虽然规划看得远，但目标没变——必须在有限步数内停死。
结果：论文证明了，一旦赛车进入了某个安全区域，它就能在固定的步数（比如 7 步、11 步）内精准停在原点，并且之后永远保持在那里，不会晃来晃去。

4. 它能控制什么？

这个方法非常强大，不仅适用于简单的单轮车（单输入线性系统），还能控制多轮车（多输入系统，比如同时控制油门和转向），甚至能控制那些路况复杂、车身会变形的非线性系统（只要它们能经过数学变换变成线性系统）。

5. 总结：这就像什么？

如果把控制一个复杂的机器比作**“在迷宫里找出口”**：

旧方法：只盯着出口看，如果起点稍微偏一点，就告诉你“无路可走”。
新方法：虽然出口很远，但它拥有一张**“无限延伸的地图”**。它不强迫你每一步都直冲出口，而是计算从中间某一步开始，一直走到永远的最优路径。
- 因为它看得远，所以它敢从迷宫的更深处出发（扩大可行域）。
- 因为它算得细，所以它不需要在出口前突然急转弯（避免约束违反）。
- 最终，它依然能保证你在有限的步数内精准走出迷宫（有限时间稳定）。

一句话总结：这篇论文发明了一种更聪明、更宽容的“停车算法”，让机器能在有各种限制的情况下，从更远的地方出发，平滑、快速且精准地停在目标点，而不用冒进或频繁切换模式。

Each language version is independently generated for its own context, not a direct translation.

这是一份关于论文《Constrained finite-time stabilization by model predictive control: an infinite control horizon framework》（基于模型预测控制的约束有限时间镇定：一种无限控制时域框架）的详细技术总结。

1. 研究背景与问题定义 (Problem)

核心问题：
现有的离散系统有限时间模型预测控制（Finite-time MPC）方法通常存在初始可行域（Initial Feasibility Region）受限的问题。

现有方法的局限性： 传统的有限时间 MPC 往往依赖以下策略：
1. 终端等式约束（Terminal Equality Constraint）： 强制状态在有限步内精确到达原点。这极大地限制了初始状态的范围，导致许多初始点无法找到可行解。
2. 单步区域切换（Switching inside one-step region）： 需要复杂的切换逻辑。
3. 短时域终端代价（Short-horizon terminal cost）： 控制时域较短，仅惩罚终端代价，导致可行域狭窄。
目标： 设计一种新的 MPC 框架，能够在满足状态和控制约束的前提下，实现系统的有限时间镇定（即状态在有限步数内精确收敛到零），同时显著扩大初始可行域，且无需终端等式约束或复杂的切换策略。

2. 方法论 (Methodology)

本文提出了一种基于**无限控制时域（Infinite Control Horizon）**的有限时间 MPC 框架，并通过等效的有限时域形式实现。

核心设计思想：

无限时域代价函数： 与传统 MPC 不同，该框架将阶段代价（Stage Costs）的求和起点设定为系统维数 $n$ ，并延伸至无穷大。
- 代价函数形式： $J(k) = \sum_{i=n}^{\infty} (\|x(i|k)\|_Q^2 + \|u(i|k)\|_R^2)$ 。
- 物理意义： 在系统维数 $n$ 之前的步骤（$0 $到$ n-1 $）不直接惩罚，允许控制器利用这些自由度将状态驱动到“终端集”；从第$ n$ 步开始，系统进入类似死拍（Deadbeat）控制的模式，确保后续状态快速收敛。
等效有限时域实现： 虽然理论框架基于无限时域，但为了计算可行性，将其转化为一个有限时域 MPC 问题：
- 控制时域 $N$ 设为大于系统维数 $n$ 的有限值。
- 代价函数包含从 $n$ 到 $N-1$ 的阶段代价之和，以及一个终端代价项 $\|x(N|k)\|_P^2$ 。
- 终端约束 $X_f$ 是一个不变集，由 Lyapunov 方程求解得到的权重矩阵 $P$ 定义。
理论保证：
- 递归可行性： 只要初始时刻可行，后续时刻均保持可行。
- 有限时间收敛： 证明一旦状态轨迹进入预定义的终端集，闭环系统将在有限步数内精确收敛到零。
- 无终端等式约束： 通过无限时域代价的累积效应自然实现收敛，无需强制 $x(N)=0$ 。

扩展性：

该方法被系统地扩展到了：

多输入线性系统： 通过解耦变换，将多输入系统视为多个单输入子系统处理。
受约束非线性系统： 针对反馈线性化（Feedback Linearizable）的非线性系统，利用非线性微分同胚将其转化为线性形式进行设计。

3. 主要贡献 (Key Contributions)

提出无限时域有限时间 MPC 框架： 摒弃了传统的终端等式约束和单步切换策略，通过从系统维数 $n$ 开始求和的无限时域代价函数，从根本上解决了初始可行域受限的问题。
等效有限时域实现与计算可行性： 证明了无限时域问题可以等价地转化为带有终端代价的有限时域优化问题，确保了算法在实际中的可计算性（Computational Tractability）。
显著扩大的初始可行域： 理论证明和仿真表明，通过延长控制时域，该方法能处理比传统短时域 MPC 大得多的初始状态集合。
通用性扩展： 成功将框架推广至多输入线性系统和一类受约束的反馈线性化非线性系统。
严格理论证明： 证明了在满足约束条件下，闭环系统具有递归可行性和严格的有限时间稳定性（Finite-time Stability）。

4. 仿真结果 (Results)

论文通过数值仿真验证了理论结果：

单输入线性系统：
- 系统为 2 阶，控制时域 $N=8$ 。
- 结果： 闭环状态在 7 步 内精确收敛到原点，且全程未违反状态和控制约束。
- 对比： 与传统的终端代价策略（ $N=n$ ）相比，新方法的初始可行域（图 2 中实线区域）显著大于传统方法（虚线区域）。
多输入线性系统：
- 3 阶系统，双输入。
- 结果： 瞬态过程在 11 步 内完成，状态和输入均满足约束。
非线性系统：
- 针对反馈线性化的非线性模型。
- 结果： 闭环系统在 5 步 内收敛到原点，验证了方法对非线性系统的适用性。
鲁棒性测试：
- 在存在有界随机扰动（最大为控制限幅的 10%）的情况下，系统状态最终有界（Ultimate Boundedness），且控制输入始终在约束范围内，证明了方法的鲁棒性。

5. 意义与结论 (Significance & Conclusion)

学术与工程意义：

突破可行性瓶颈： 该研究解决了有限时间 MPC 长期存在的“初始可行域小”的痛点，使得有限时间控制策略能够应用于更多初始条件的实际场景。
简化控制逻辑： 去除了复杂的终端等式约束和切换逻辑，使得控制器设计更加简洁、统一。
平衡性能与约束： 在保证有限时间快速收敛（满足高精度、快响应需求）的同时，有效处理了物理约束，避免了因过度激进控制导致的约束违反。

局限性：

计算负担： 由于控制时域 $N$ 需要设置得较大（ $N > n$ ），相比短时域 MPC，在线优化计算量有所增加。
收敛时间估算： 虽然证明了有限时间收敛，但具体的收敛时间 $T$ 依赖于具体的约束和设计参数，目前缺乏显式的紧上界计算公式（这是未来的工作方向）。
非线性适用范围： 目前仅适用于反馈线性化的非线性系统，对于更一般的非线性系统仍需进一步研究。

总结：
本文提出了一种创新的无限时域框架，成功将 MPC 的约束处理能力与有限时间镇定性能相结合。通过巧妙的代价函数设计，它在无需牺牲可行性的前提下实现了严格的有限时间收敛，为受约束系统的快速控制提供了一套通用且有效的解决方案。