From Scale to Speed: Adaptive Test-Time Scaling for Image Editing

本文提出了自适应编辑思维链(ADE-CoT)框架,通过难度感知资源分配、编辑特定验证及深度优先机会性停止策略,有效解决了将图像思维链应用于图像编辑时的资源低效与验证不可靠问题,在显著提升编辑性能的同时实现了超过两倍的推理加速。

Xiangyan Qu, Zhenlong Yuan, Jing Tang, Rui Chen, Datao Tang, Meng Yu, Lei Sun, Yancheng Bai, Xiangxiang Chu, Gaopeng Gou, Gang Xiong, Yujun Cai

发布于 2026-03-03
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文提出了一种名为 ADE-CoT 的新方法,旨在让 AI 修图变得更、更聪明,同时还能省钱(节省计算资源)。

为了让你轻松理解,我们可以把 AI 修图想象成**“让一位画家根据指令给照片改画”**的过程。

1. 以前的做法:笨办法(Best-of-N)

以前的 AI 修图(Image-CoT)就像是一个**“人海战术”**:

  • 场景:你给 AI 指令:“把这只猫变成在跑步”。
  • 旧方法:AI 不管指令难不难,直接让画家(AI 模型)画 32 张 不同的图。
    • 有的画得乱七八糟,有的画得还行,有的画得完美。
    • 画完后,AI 再挑出最好的一张给你。
  • 问题
    1. 浪费体力:如果指令很简单(比如“把背景变蓝”),AI 画第一张可能就对了,但它非要画 32 张,浪费了大量时间。
    2. 看走眼:在画的过程中(还没画完时),AI 会先看看草图。如果草图看起来有点模糊,AI 可能会误以为这张画废了,直接扔掉。结果发现,那张“废画”其实只要再画几笔就是神作。
    3. 重复劳动:有时候 AI 画了 32 张,其中 30 张都是“完美跑步猫”,长得几乎一模一样。你只需要一张,它却画了 30 张一样的,纯属浪费。

2. 这篇论文的解决方案:ADE-CoT(聪明的策略)

作者给 AI 装上了三个“超能力”,让它从“盲目画 32 张”变成“按需作画”:

第一招:看人下菜碟(难度感知资源分配)

  • 比喻:就像点外卖
    • 如果你点的是“白开水”(简单任务),AI 只派一个新手画家,画 1 张就够了,画完直接给你,省时省力。
    • 如果你点的是“满汉全席”(复杂任务,比如让人物大变身),AI 就派一个大师团队,画 32 张甚至更多,直到画出完美的为止。
  • 效果:简单任务不浪费,复杂任务给足资源。

第二招:火眼金睛(针对修图的专用验证)

  • 比喻:就像装修监理
    • 以前的监理(通用 AI)只看整体感觉,觉得“这面墙颜色有点怪”就把它拆了。
    • 现在的监理(专用验证)会拿着图纸(你的指令)去核对:
      • 核对位置:指令说“换掉红色的车”,监理会专门盯着那辆车看,而不是看旁边的树。如果树没动,车变了,哪怕草图有点模糊,它也判定为“有潜力,继续画”。
      • 核对描述:它会先让 AI 描述一下“理想中的图”应该长什么样,再对比现在的图,确保没跑偏。
  • 效果:不再因为草图模糊就误杀好苗子,能更精准地留住好作品。

第三招:见好就收(深度优先与机会主义停止)

  • 比喻:就像寻宝游戏
    • 以前的方法是:把 32 个箱子全部打开,看完再选最好的。
    • 现在的方法是:按顺序一个一个开箱子。
      • 一旦打开一个箱子,发现里面是完美的宝藏(完全符合指令),而且经过“专家”(实例验证器)仔细检查确认无误,立刻停止
      • 后面的 30 个箱子根本不用开了,因为已经找到目标了,再开也是重复的。
  • 效果:一旦找到满意的,立马收工,绝不画蛇添足。

3. 最终成果

通过这三招,ADE-CoT 实现了:

  • 速度翻倍:在达到同样甚至更好效果的情况下,速度比旧方法快了 2 倍以上
  • 质量更高:因为不再误杀好苗子,也不再浪费时间在简单任务上,最终修出来的图更精准。
  • 更省钱:大大减少了 AI 模型需要计算的次数(就像少烧了半个月的电)。

总结

这就好比以前修图是**“不管三七二十一,先画 32 张再说,最后挑一张”;现在变成了“先评估难度,简单的一笔画完,复杂的多画几张;画的过程中用专业眼光盯着,一旦发现完美的就立刻喊停”**。

这让 AI 修图从“ brute force(蛮力)”进化到了“smart work(巧干)”。