Training-free Mixed-Resolution Latent Upsampling for Spatially Accelerated Diffusion Transformers

本文提出了一种无需训练的混合分辨率潜在上采样框架 RALU,通过针对易产生伪影的边缘区域进行自适应上采样及噪声时间步匹配,在保持生成质量的同时显著加速了扩散 Transformer 模型。

Wongi Jeong, Kyungryeol Lee, Hoigi Seo, Se Young Chun

发布于 2026-02-26
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一种名为 RALU 的新方法,它能让现在的顶级 AI 绘画模型(比如 FLUX 和 Stable Diffusion 3)画得更快,而且画质不下降

为了让你轻松理解,我们可以把 AI 画画的过程想象成一位画家在画一幅巨大的油画

1. 现在的痛点:画家太累了

现在的 AI 模型(特别是基于 Transformer 的 DiT 模型)非常强大,能画出照片级的细节。但是,它们画一幅画需要非常长的时间,就像一位画家必须从第一笔开始,每一寸画布都极其精细地描绘,哪怕是一大片蓝天,他也得一笔一笔地涂。

  • 问题:计算量太大,画一张图太慢,没法实时使用。
  • 现有的笨办法
    • 方法 A(时间加速):让画家“快进”思考,跳过一些步骤。但这就像让画家闭着眼乱画,容易画崩,或者细节模糊。
    • 方法 B(空间加速 - 旧版):让画家先画一张小图(低分辨率),然后再把它放大。但这就像把一张小照片强行拉大,边缘会变得锯齿状、模糊(这就是论文说的“混叠伪影”),或者颜色不对劲(“分布不匹配”)。

2. RALU 的创意:聪明的“分区施工”

这篇论文的作者发现,如果全部都先画小图再放大,画面会崩坏;如果全部都画大图,速度又太慢。

于是,他们想出了一个**“混合分辨率”的聪明策略,叫 RALU。我们可以把它想象成装修房子**:

  • 核心思想:不要对房子的每一面墙都花同样的力气。
    • 墙壁(背景):比如大面积的蓝天、草地,这些细节要求不高。我们可以先画个小样(低分辨率),快速搞定,省时间。
    • 门窗和装饰画(边缘/细节):比如人的轮廓、物体的边缘、复杂的纹理。这些地方如果用小样放大,会很难看。所以,我们要提前在这些关键区域画大图(高分辨率)。

RALU 的工作流程就像这样:

  1. 先画草图(低分辨率):画家先在画布上快速勾勒整体轮廓和背景,这时候画布很小,速度极快。
  2. 智能放大(区域自适应)
    • 画家拿出放大镜,只盯着边缘和细节丰富的地方(比如狗的耳朵、车轮的轮廓)。
    • 只把这些局部放大成高清大图,并立刻开始精细描绘。
    • 而背景部分(比如天空)依然保持小图状态,继续快速处理。
  3. 最后融合:当所有部分都处理完后,再把背景也放大,拼成一张完整的高清大图。

3. 解决两个“翻车”现场

作者发现,直接放大会有两个大问题,RALU 也给出了完美的“补丁”:

  • 问题一:锯齿和模糊(混叠伪影)

    • 比喻:就像把低像素的像素画强行拉大,边缘全是锯齿。
    • RALU 的解法“早动手”。不要在画完所有细节后再放大,而是在刚开始画草图、轮廓还很模糊的时候,就先把边缘部分放大。这样,画家从一开始就是在大画布上描绘边缘,自然就没有锯齿了。
  • 问题二:颜色和光影对不上(分布不匹配)

    • 比喻:就像你突然把画从“小房间”搬到了“大房间”,光线变了,原来的颜色看起来就不对了。
    • RALU 的解法“调整光线”(NT-Matching)。在放大的瞬间,作者设计了一套数学公式,像调整摄影棚灯光一样,重新校准了放大部分的光影和噪点,让它完美融入整体,不会显得突兀。

4. 效果有多牛?

  • 速度快:在 FLUX 模型上,速度提升了 7 倍;在 Stable Diffusion 3 上提升了 3 倍
  • 画质好:几乎看不出画质下降,也没有那些难看的锯齿或模糊。
  • 还能叠加:这个方法可以和现有的“时间加速”方法(让画家思考更快)结合起来用,最高能实现 15.9 倍 的加速!

总结

RALU 就像是一位懂行情的装修队长
他不再傻乎乎地全屋都贴最贵的瓷砖(全高清计算),也不随便拿报纸糊墙(全低清计算)。
只在需要精细装修的“关键区域”(边缘)提前贴瓷砖,而在空旷的“背景区域”先刷大白(低清快速处理)。

结果就是:房子(图片)装修得又快又好,既省了钱(算力),又没牺牲质量。 这让 AI 绘画在普通电脑甚至手机上实时运行成为了可能。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →