TC-Padé: Trajectory-Consistent Padé Approximation for Diffusion Acceleration

本文提出了轨迹一致帕德近似(TC-Padé)框架,通过有理函数建模特征演化及自适应系数调制策略,有效解决了扩散模型在低步数(20-30 步)采样下的误差累积与轨迹漂移问题,在显著加速图像和视频生成的同时保持了高质量的生成效果。

Benlei Cui, Shaoxuan He, Bukun Huang, Zhizeng Ye, Yunyun Sun, Longtao Huang, Hui Xue, Yang Yang, Jingqun Tang, Zhou Zhao, Haiwen Hong

发布于 2026-03-04
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一种名为 TC-Padé 的新技术,旨在解决当前 AI 绘画和视频生成模型(扩散模型)“画得慢”的痛点。

为了让你轻松理解,我们可以把 AI 生成图像的过程想象成一位画家在画一幅复杂的风景画

1. 现状:为什么现在的 AI 画得慢?

目前的 AI 绘画(如 FLUX.1)就像一位极其谨慎的画家

  • 传统画法:为了画好一张图,画家需要走 50 步(50 个去噪步骤)。每一步,他都要停下来,仔细思考、修改、再画一笔。这就像走楼梯,一步一个台阶,非常稳,但速度很慢。
  • 加速尝试:为了快一点,以前的加速方法(比如“特征缓存”)就像是让画家**“偷懒”**。
    • 旧方法 A(直接复用):如果画家觉得刚才那一步和现在这一步差不多,就直接把刚才的画拿来用,不再重画。但这有个问题:如果步子跨得太大(比如从第 50 步直接跳到第 20 步),中间的变化其实很大,直接复用会导致画面崩坏(颜色不对、纹理乱飞)。
    • 旧方法 B(泰勒预测):另一种方法是让画家**“猜”下一步会画什么。以前的方法是用“泰勒级数”(一种数学公式)来猜,就像用一条直线**去预测曲线的走向。在短距离内(步子小)猜得挺准,但一旦步子跨大了(比如一步跨 10 格),直线就偏离了曲线,导致预测错误,画出来的东西就“跑偏”了。

2. 核心创新:TC-Padé 是怎么做的?

这篇论文提出的 TC-Padé 就像给画家装了一个**“超级导航仪”“智能节奏控制器”**。它主要做了两件聪明的事:

A. 换个角度“猜”未来:从画直线变成画曲线

以前的预测方法(泰勒级数)像是在用直尺去画曲线,越远越不准。
TC-Padé 使用的是帕德近似(Padé Approximation)

  • 比喻:想象你要预测一辆车在弯道的轨迹。
    • 旧方法:用直尺画一条线,车开远了就撞墙了。
    • TC-Padé:它用的是一种**“有理函数”(分子分母都是多项式),这就像是用柔软的橡皮筋或者智能轨道**去贴合弯道。即使步子跨得很大,它也能完美地贴合住曲线的走向,捕捉到那种“突然转弯”或“逐渐加速”的复杂变化。
  • 关键点:它不直接预测“画出来的图”,而是预测**“画布的变化量”(残差)**。就像画家不再预测整幅画,只预测“这一笔比上一笔多了什么”,这样更容易猜对。

B. 智能节奏控制:该快则快,该慢则慢

以前的加速方法不管什么时候都“一刀切”,要么全猜,要么全画。
TC-Padé 引入了**“轨迹稳定性指示器”(TSI),就像画家的“直觉”**:

  • 平稳期:如果画家发现画面变化很平稳(比如画天空的渐变),TSI 就会说:“稳了,不用算,直接按导航猜!”(跳过计算,加速)。
  • 动荡期:如果画家发现画面正在发生剧烈变化(比如画眼睛的细节,或者突然出现的物体),TSI 就会报警:“这里不稳,不能猜,必须亲自画!”(全量计算,保质量)。
  • 分阶段策略:它还能根据绘画的不同阶段(起稿、铺色、精修)调整预测策略。起稿时变化大,就少猜;精修时变化小,就多猜。

3. 效果如何?

在实验中,TC-Padé 展现了惊人的效果:

  • 速度:在 FLUX.1 模型上,它能把生成速度提升 2.88 倍(原本 20 步,现在相当于只用了很少的计算量就达到了类似效果)。
  • 质量:虽然步子跨得大,但画出来的图依然清晰、颜色正、细节好,没有那种“糊成一团”或“颜色乱飞”的灾难性后果。
  • 视频:在视频生成(Wan2.1)上,速度提升了 1.72 倍,且视频流畅度没有明显下降。

4. 总结

简单来说,TC-Padé 就是给 AI 画家装上了一套**“懂数学的直觉系统”
它不再死板地一步步走,也不再盲目地直线猜测。它懂得在平稳时
“滑翔”(加速),在复杂时“刹车”**(保真),并且用更高级的数学工具(帕德近似)来预测未来的变化。

一句话概括:它让 AI 画画从“笨拙的慢工出细活”,变成了“聪明的快准狠”,在保持高质量的同时,让生成速度翻了近三倍。