Spread them Apart: Towards Robust Watermarking of Generated Content

本文提出了一种在推理阶段嵌入水印的无需重训练方法,用于生成式图像内容的版权保护与溯源,并证明了该水印在对抗加性扰动及多种合成移除攻击时具有鲁棒性。

Mikhail Pautov, Danil Ivanov, Andrey V. Galichin, Oleg Rogov, Ivan Oseledets

发布于 2026-03-02
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文提出了一种名为"Spread them Apart"(把它们分开)的新方法,用来给 AI 生成的图片打上“隐形水印”。

为了让你轻松理解,我们可以把这件事想象成给 AI 画的画盖上“隐形印章”

1. 为什么要这么做?(背景故事)

现在的 AI(比如画图的扩散模型)太厉害了,画出来的猫、风景甚至人像都跟真的一样。这带来两个麻烦:

  • 真假难辨:你分不清这是摄影师拍的,还是 AI 画的。
  • 版权混乱:有人用 AI 画了一幅画,然后声称“这是我画的”,甚至拿去卖钱,侵犯了原作者或 AI 公司的权益。

我们需要一种方法,既能证明“这张图是 AI 画的”,又能查出“是哪个用户让 AI 画的”。

2. 核心创意:把像素“拉开距离”

传统的“水印”像是在图片上盖个半透明的章,或者把信息藏在频率里,容易被修图软件抹掉。

这篇论文的方法非常聪明,它不盖印章,而是强迫图片里的两个像素点“站得远远的”

  • 比喻:想象你在一张白纸上画两个点,A 点和 B 点。
    • 如果 AI 要代表“数字 0",它必须让 A 点比 B 点亮
    • 如果 AI 要代表“数字 1",它必须让 A 点比 B 点暗
    • 而且,它不能只是稍微亮一点点,必须亮得足够多(比如亮 0.2 个单位),这样就算有人后来把整张图调暗了,A 点依然比 B 点亮。

这就是论文标题"Spread them Apart"(把它们分开)的含义:强制拉开两个像素点的亮度差距

3. 具体是怎么操作的?(三个步骤)

第一步:发“秘密钥匙”

当用户注册使用 AI 服务时,系统会给他发一把私钥(Secret Key)。

  • 这把钥匙里包含了一大堆成对的坐标(比如:第 10 个像素和第 500 个像素是一对)。
  • 同时,系统给每个用户分配一串二进制密码(比如:01011...),这就是他的“身份 ID"。

第二步:AI 画画时“偷偷改代码”

当用户输入提示词(比如“一只黑猫”)让 AI 画画时,AI 在生成图片的过程中,会同时做两件事:

  1. 努力画得像:保证猫看起来逼真。
  2. 努力符合密码:AI 会微调图片,确保那些“成对的像素点”符合用户的密码。
    • 如果密码是"1",AI 就调整画面,让第 10 个像素比第 500 个像素
    • 如果密码是"0",AI 就调整画面,让第 10 个像素比第 500 个像素

关键点:这个过程是在 AI 生成图片的最后一刻完成的,不需要重新训练 AI 模型,就像是在画完画后,用极细的笔尖悄悄调整了两个点的颜色,肉眼根本看不出来。

第三步:事后“验明正身”

如果这张图后来被拿出来了,版权方想知道“这是谁画的”:

  1. 拿出用户的私钥(那堆坐标对)。
  2. 检查图片里对应的像素点:
    • 如果第 10 个点比第 500 个点暗,那就解码出"1"。
    • 如果亮,就解码出"0"。
  3. 把所有解码出来的数字拼起来,看看是不是某个用户的密码。如果是,那就锁定是他画的。

4. 为什么这个方法很厉害?(鲁棒性)

这个方法最牛的地方在于抗干扰能力,论文里用了数学证明:

  • 抗“调光”:如果有人把图片整体调亮或调暗(比如把照片变黑),只要两个点的相对差距还在,水印就还在。就像两个人比身高,就算把他们都放在电梯里升高了,高个子依然比矮个子高。
  • 抗“旋转/翻转”:论文还提出了一种进阶版(Section 5),不仅检查像素点,还检查图片的数学特征(比如旋转不变的特征)。
    • 比喻:就像你不仅看两个人的身高,还看他们手牵手的姿势。就算把照片旋转 90 度,或者把照片倒过来,这种特殊的“数学姿势”依然能识别出来。
  • 抗“恶意攻击”:即使有人用高级算法试图抹除水印(白盒攻击),只要攻击力度不超过一定限度,水印依然能幸存。

5. 实验结果怎么样?

作者用 Stable Diffusion(目前最火的画图 AI)做了测试:

  • 肉眼看不出:加了水印的图和原图几乎一模一样,画质没有下降。
  • 很难被洗掉:经过调亮度、调对比度、加噪点、甚至压缩成 JPEG 后,水印依然能被准确识别。
  • 比对手强:在抵抗各种“去水印攻击”的测试中,这个方法的表现优于目前市面上其他最先进的方案。

总结

这篇论文就像给 AI 生成的图片装了一个隐形的、防篡改的“指纹锁”

它不需要给 AI 重新“上课”(训练),而是在 AI 画画的时候,悄悄地把两个像素点的距离“拉开”,以此记录用户的身份。无论别人怎么给图片调色、旋转或压缩,只要这个“距离关系”还在,就能揪出是谁用 AI 画了这张图。这对于解决 AI 时代的版权和伦理问题,提供了一个非常实用的工具。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →