Rethinking Preference Alignment for Diffusion Models with Classifier-Free Guidance

该论文提出了一种名为“对比引导”的新方法,通过将偏好对齐重构为分类器自由引导(CFG)形式,利用在正负数据上分别训练的模块在推理阶段生成可调控的引导信号,从而在不重新训练基础模型的情况下显著提升了扩散模型对复杂人类偏好的对齐效果与泛化能力。

Zhou Jiang, Yandong Wen, Zhen Liu

发布于 2026-02-24
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇文章提出了一种让 AI 画图更“听话”、更符合人类喜好的新方法。为了让你轻松理解,我们可以把整个故事想象成教一个刚出道的画家(AI 模型)如何画出大家喜欢的画

1. 背景:画家的困惑

现在的 AI 绘画模型(比如 Stable Diffusion)就像是一个看过互联网上亿张图片的“天才画家”。它画什么都能画,但因为它看过的图太杂了,有时候它画出来的东西虽然技术上没问题,但不符合人类的审美,或者听不懂你的具体指令(比如你让它画“开心的猫”,它可能画个“生气的猫”)。

以前,人们想纠正这个画家,通常用两种方法:

  • 方法 A(强化学习 RLHF): 请一个专门的“评委”给画打分,然后让画家根据分数反复练习。这很有效,但太复杂、太贵,而且很难调教。
  • 方法 B(直接偏好优化 DPO): 直接给画家看“好画”和“坏画”的对比,告诉它:“别学那个坏的,学这个好的”。这很简单,但有个大毛病:画家容易“死记硬背”。它把训练集里的“好画”背得滚瓜烂熟,但一旦遇到没见过的题目,它就乱画了,甚至忘了怎么画正常的画(这叫“过拟合”和“灾难性遗忘”)。

2. 核心灵感:不要“重练”,要“带个向导”

这篇论文的作者发现,与其让画家重新苦练(重新训练模型),不如在画家下笔的时候,旁边站个“向导”

这就好比:

  • 画家(基础模型): 负责画底稿,保证画面不乱,保持原本的风格。
  • 向导(微调后的模型): 只负责在关键地方指指点点,告诉画家:“这里颜色不对,那里形状要改”。

作者把这种“指指点点”的技术叫做 CFG(无分类器引导)。以前的 CFG 是用来控制画什么内容的(比如“画一只猫”),而这篇论文把它用来控制**“画得讨不讨喜”**。

3. 他们的新方法:PGD 和 cPGD

方法一:PGD(偏好引导扩散)—— “老带新”

  • 做法: 作者训练了一个小小的“向导模型”。这个向导只看了几千张“好画”和“坏画”的对比,稍微学了一点偏好,并没有完全重练。
  • 原理: 在 AI 生成图片的最后阶段,把“基础画家”的预测和“向导”的预测结合起来。
    • 公式很简单:最终结果 = 基础画家 + 向导的修正意见
    • 如果向导说“这个不好”,我们就把画往好的方向推一点。
  • 比喻: 就像你让一个经验丰富的老画家(基础模型)画画,旁边站着一个懂审美的艺术评论家(向导)。老画家负责大框架,评论家负责在关键笔触上提点:“这里光影不对,改一下”。这样既保留了老画家的功底,又融入了评论家的审美,而且评论家不需要重新学画画,只要稍微指点一下就行

方法二:cPGD(对比偏好引导)—— “红白脸”策略

这是 PGD 的升级版,更聪明。

  • 做法: 作者训练了两个向导:
    1. 红脸向导: 专门看“好画”,学会怎么画大家喜欢的。
    2. 白脸向导: 专门看“坏画”,学会怎么避开大家讨厌的。
  • 原理: 在生成时,用“红脸向导”的想法,减去“白脸向导”的想法。
    • 公式:最终修正 = (喜欢好画的向导) - (喜欢坏画的向导)
  • 比喻: 这就像你让两个专家给你提建议。
    • 专家 A 说:“这里要加个笑脸。”
    • 专家 B 说:“千万别画成哭脸。”
    • 你把 A 的建议加上,再把 B 的“避坑指南”减掉,剩下的就是最完美的方案。
    • 这种方法的好处是,它把“喜欢什么”和“讨厌什么”分开了,不容易死记硬背,泛化能力更强,画出来的图既符合审美,又不会变得怪里怪气。

4. 为什么这个方法牛?

  1. 不伤筋动骨(无需重训): 不需要把那个巨大的基础模型重新训练一遍(那太费钱了)。只需要训练几个小小的“向导模块”,像插件一样插进去用。
  2. 防止“死记硬背”: 传统的 DPO 方法容易让 AI 变得僵化,只会在训练过的题目上表现好。这种方法通过“向导”在生成时动态调整,让 AI 在面对新题目时依然灵活。
  3. 可插拔(Plug-and-Play): 就像给手机换个壳一样。如果你换了个新的 AI 模型,只要把训练好的“向导”插上去,新模型立马就能变得很懂人类喜好。
  4. 效果显著: 在测试中,这种方法画出来的图,人类更喜欢,而且图片的多样性(不千篇一律)和清晰度都保持得很好。

总结

这篇论文的核心思想就是:别逼着 AI 重新学做人(重新训练),而是给它配个“懂行”的助手(向导),在画画的时候实时指导它。

  • PGD 是配一个懂审美的助手。
  • cPGD 是配两个助手,一个教“怎么做”,一个教“别怎么做”,两者结合,效果最好。

这种方法简单、高效,而且让 AI 画出的图既听话又自然,解决了目前 AI 绘画“懂技术但不懂人心”的痛点。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →