SPEED: Scalable, Precise, and Efficient Concept Erasure for Diffusion Models

该论文提出了 SPEED,一种通过直接编辑模型参数并搜索“零空间”来实现的可扩展、精确且高效的扩散模型概念擦除方法,该方法结合三种互补策略在确保非目标概念生成质量的同时,仅需 5 秒即可擦除 100 个概念。

Ouxiang Li, Yuan Wang, Xinting Hu, Houcheng Jiang, Yanbin Hao, Fuli Feng

发布于 2026-03-03
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一种名为 SPEED 的新方法,专门用来解决一个让 AI 绘画(文生图模型)很头疼的问题:如何“忘记”某些特定的东西,同时又不把其他东西也忘了?

想象一下,你有一个超级聪明的画家(AI 模型),他什么都会画。但是,现在有人要求他:

  1. 彻底忘掉“史努比”(Snoopy)(可能是版权原因)。
  2. 彻底忘掉“史努比”、“米老鼠”和“海绵宝宝”这 100 个卡通明星(可能是隐私或版权原因)。
  3. 但是,他必须依然能完美地画出“Hello Kitty"、“海绵宝宝”(如果没被删)或者“梵高风格”的画,不能画歪了。

以前的方法要么太慢(像重新教画家一样,耗时耗力),要么太笨(为了忘掉史努比,结果把米老鼠也画成了史努比,或者把画风都搞乱了)。

SPEED 方法就像给这位画家装了一个“智能橡皮擦”和“记忆过滤器”,它有三个超能力:

1. 极速(Efficient):像闪电一样快

以前的方法如果要擦除 100 个明星,可能需要跑几个小时甚至几天。SPEED 只需要 5 秒钟

  • 比喻:以前的方法像是在用砂纸一点点打磨掉画上的 100 个名字,而 SPEED 像是用一把高科技的“激光手术刀”,瞬间精准切除,毫不拖泥带水。

2. 精准(Precise):只擦掉想擦的,不伤及无辜

这是最难的部分。如果你告诉画家“忘掉史努比”,他可能会把“所有狗”都忘掉,或者把“米老鼠”画得怪模怪样。

  • 比喻:想象你在一个满是各种颜色颜料的调色盘上,只想把“史努比”这种特定的蓝色去掉。以前的方法可能会把整个调色盘都洗一遍,导致其他颜色变淡。
  • SPEED 的做法:它找到了一个神奇的“零空间”(Null Space)。你可以把它想象成调色盘上的一个“隐形夹层”。SPEED 把修改指令只在这个夹层里操作。在这个夹层里动笔,只会改变“史努比”的画法,而完全不会触碰到“米老鼠”或“梵高风格”的颜料。就像你在一个隔音极好的房间里大声唱歌,隔壁房间的人完全听不到。

3. 可扩展(Scalable):从擦一个到擦一百个,轻松搞定

以前的方法,擦除的概念越多,冲突就越严重,效果越差。SPEED 却能轻松应对擦除 100 个明星的任务。

  • 比喻:以前的方法像是在玩“贪吃蛇”,蛇头(要擦除的概念)越长,身体(保留的知识)就越容易撞墙。SPEED 则像是一个智能管家,它能先帮你把“不需要保留的无关紧要的记忆”过滤掉,只保留真正重要的“核心记忆”来构建那个“隐形夹层”。

SPEED 是怎么做到的?(三大绝招)

为了构建这个完美的“隐形夹层”,SPEED 用了三个聪明的策略:

  1. 影响筛选 (IPF) —— “抓大放小”

    • 原理:并不是所有“不想被擦除”的概念都会受到“擦除史努比”的影响。有些概念离史努比很远,根本不受影响。
    • 比喻:如果你要删除“史努比”的记忆,其实“埃菲尔铁塔”和“苹果”根本不在乎。SPEED 会先算一下,只把那些真的会被波及的概念(比如“米老鼠”)留下来作为“保护对象”,把那些无关紧要的踢出去。这样,保护层的负担就轻了,更容易构建出完美的“隐形夹层”。
  2. 定向增强 (DPA) —— “举一反三”

    • 原理:光保留几个概念不够,万一画家只记得“米老鼠戴帽子”,忘了“米老鼠不戴帽子”怎么办?
    • 比喻:SPEED 会给保留的概念加一些有方向的“微扰”。就像你教孩子认“猫”,不仅给他看一只猫,还给他看不同姿势、不同角度的猫,但绝不让他看到“狗”。这样,画家对“猫”的记忆就更全面、更牢固,擦除“史努比”时,就不会误伤“猫”了。
  3. 不变量约束 (IEC) —— “守住底线”

    • 原理:有些东西是 AI 画画的基础,比如“开头”或者“无条件生成”的指令,这些绝对不能变。
    • 比喻:就像盖房子,地基和承重墙绝对不能动。SPEED 给这些绝对不能变的基础结构上了锁,确保无论怎么擦除,画作的整体逻辑和基础风格都不会崩塌。

总结

SPEED 就像是一个超级高效的记忆外科医生

  • (5 秒搞定 100 个概念)。
  • (只切掉坏细胞,不伤好细胞)。
  • (不管切多少,身体机能正常)。

这项技术对于保护版权(不让 AI 画受保护的明星)、保护隐私(不让 AI 画特定的人)以及过滤不良内容(不让 AI 画暴力色情)具有巨大的实用价值,而且不需要重新训练整个 AI 模型,直接“动手术”修改参数即可。