EraseAnything++: Enabling Concept Erasure in Rectified Flow Transformers Leveraging Multi-Object Optimization

本文提出了 EraseAnything++,一种针对基于流匹配和 Transformer 架构的图像及视频生成模型的概念擦除统一框架,通过多目标优化、隐式梯度手术及注意力正则化等策略,在有效移除不良概念的同时显著提升了生成质量与时序一致性。

Zhaoxin Fan, Nanxiang Jiang, Daiheng Gao, Shiji Zhou, Wenjun Wu

发布于 2026-03-03
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一种名为 EraseAnything++ 的新技术,它的核心任务可以比喻为:给拥有“超能力”的 AI 画家和导演做一场精准的“记忆切除手术”,同时保证他们不会变成“失忆症”患者。

为了让你更容易理解,我们可以把这篇论文拆解成几个生动的故事场景:

1. 背景:AI 画家和导演的“成长烦恼”

现在的 AI(比如 Stable Diffusion v3, Flux, OpenSora)非常厉害,它们能根据文字画出逼真的图片,甚至生成流畅的视频。

  • 问题:这些 AI 是在互联网海量数据上训练的,所以它们脑子里也存了一些“坏东西”(比如色情内容、暴力画面、或者某些不该出现的明星)。
  • 现状:以前的方法就像是用大锤砸墙——想去掉墙上的污渍(坏概念),结果把整面墙(AI 的绘画能力)都砸坏了,或者污渍没去干净,换个说法(比如把“裸体”写成“没穿衣服”)AI 又画出来了。
  • 新挑战:现在的 AI 架构变了(从 U-Net 变成了 Transformer,从画静态图变成了拍视频),以前的“大锤”方法不管用了。

2. 核心方案:EraseAnything++ 的“三把手术刀”

作者提出了一套全新的方案,我们可以把它想象成一位高明的外科医生,手里拿着三把不同的手术刀:

第一把刀:多目标优化(“走钢丝”的艺术)

  • 比喻:想象你在走钢丝。一边是“彻底忘掉坏东西”(左边),另一边是“保留画好画的能力”(右边)。
  • 以前的做法:要么为了忘掉坏东西,把钢丝砍断了(AI 变傻了);要么为了保命,根本不敢往坏东西那边看一眼(坏东西没删干净)。
  • EraseAnything++ 的做法:它发明了一种隐式梯度手术(Implicit Gradient Surgery)。这就像给 AI 装了一个智能平衡仪
    • 当“删除坏东西”的动作不会伤害“画好画”的能力时,它就大胆地删。
    • 一旦检测到删除动作快要伤到“画好画”的能力了,平衡仪就会立刻介入,把删除的方向稍微偏转一点点,就像在悬崖边跳舞,既把垃圾扔了,又没掉下悬崖。

第二把刀:针对 Transformer 的“注意力聚焦”(给 AI 戴眼罩)

  • 比喻:现在的 AI 像是一个注意力非常集中的学生。以前的方法只是告诉学生“别想那个词”,但学生换个说法(比如把“裸体”写成“没穿”)就懂了。
  • EraseAnything++ 的做法:它利用反向自对比损失(Reverse Self-Contrastive Loss)
    • 它不只是告诉 AI“别想 A",而是强行把"A"和它的同义词(比如“没穿”)拉开距离,同时把"A"和完全无关的东西(比如“苹果”)强行拉近。
    • 效果:这就好比给 AI 洗脑,让它觉得“裸体”这个词和“苹果”一样,跟人体没关系。这样,无论用户怎么变着花样提示,AI 都反应不过来了,彻底切断了这个概念。

第三把刀:视频领域的“锚定与传播”(防止“记忆回潮”)

  • 比喻:在视频生成中,最大的问题是时间漂移。比如你让 AI 删掉视频里的“裸体”,第一帧删干净了,但到了第 10 帧,AI 可能因为记忆模糊,又把“裸体”画出来了,就像水里的墨迹慢慢晕开。
  • EraseAnything++ 的做法:它采用了**“锚定与传播”(Anchor-and-Propagate)**策略。
    • 锚定:先把视频的第一帧(锚点)彻底清理干净,确保种子是干净的。
    • 传播:然后像接力赛一样,把这种“干净”的状态强制传递到后面的每一帧,并时刻监控,防止后面的帧“偷偷”把坏东西带回来。
    • 效果:就像给视频装了一个“防回潮”的保鲜膜,确保从头到尾,坏东西都消失得干干净净。

3. 实验结果:它有多强?

作者做了很多测试,结果非常亮眼:

  • 删得干净:无论是“裸体”这种敏感词,还是“毕加索风格”这种艺术风格,它都能精准删除。
  • 记得住:删掉坏东西后,AI 依然能画出高质量、符合提示词的好图/好视频,没有变傻。
  • 防攻击:就算用户故意用错别字、乱码来骗 AI(比如把"Nike"写成"Nikke"),EraseAnything++ 依然能识破并拒绝生成。
  • 视频不卡顿:生成的视频流畅自然,没有因为删除操作而出现画面闪烁或物体突然消失的怪现象。

总结

EraseAnything++ 就像是给新一代 AI 模型配备了一套智能的、精准的、防回潮的“内容过滤器”

它不再是用蛮力去破坏模型,而是通过精妙的数学平衡(多目标优化)和针对新架构的定制策略(注意力聚焦 + 视频锚定),在彻底清除安全隐患保留 AI 强大创造力之间,找到了完美的平衡点。这让未来的 AI 既能天马行空地创作,又能安全地服务于人类。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →