ShapeMark: Robust and Diversity-Preserving Watermarking for Diffusion Models

ShapeMark 提出了一种通过结构化噪声模式编码水印位并引入随机化设计来平衡鲁棒性与多样性的扩散模型水印方法,从而在保持生成质量的同时实现了在多种有损场景下的卓越鲁棒性。

Yuqi Qian, Yun Cao, Haocheng Fu, Meiyang Lv, Meineng Zhu

发布于 Wed, 11 Ma
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一种名为 ShapeMark 的新技术,它是专门为扩散模型(比如目前流行的 AI 绘画工具)设计的一种“隐形水印”方案。

为了让你轻松理解,我们可以把 AI 生成图片的过程想象成在一张白纸上作画,而水印就是画家在作画前偷偷埋下的“签名”。

1. 核心问题:以前的“签名”太脆弱了

以前的 AI 水印技术(论文里叫 NaW 方法)就像是在画布的每一个像素点上,根据水印信息强行改变颜色(比如把某个像素点稍微调亮一点代表"1",调暗一点代表"0")。

  • 比喻:这就像你在沙滩上用手指画了一个复杂的图案来标记你的领地。
  • 缺点
    1. 太脆弱:只要海浪(图片压缩、裁剪、加噪点)稍微冲刷一下,或者有人不小心踩了一脚(图片被编辑过),你画在沙子里的深浅痕迹就模糊了,根本认不出来。
    2. 太死板:为了把字刻清楚,你不得不每次都把沙子堆成一模一样的形状。结果就是,虽然字认出来了,但画出来的画看起来都千篇一律,失去了 AI 原本那种“千变万化”的创造力。

2. ShapeMark 的解决方案:不画“点”,改画“形状”

ShapeMark 的聪明之处在于,它不再关注单个像素点的颜色深浅,而是关注一群像素点排列出来的“形状”和“顺序”

核心技巧一:结构编码 (SE) —— “打乱扑克牌”

  • 做法:AI 在生成图片前,会先产生一堆随机的“噪音”(可以想象成一副洗乱的扑克牌)。ShapeMark 把这副牌按照大小(数值大小)分成几堆(比如 4 堆),然后给每一堆里的牌编号。
  • 埋水印:它不改变牌面(数值),而是改变牌的顺序。比如,如果水印是"1",它就按顺序 A-B-C-D 排列;如果水印是"0",它就按 D-C-B-A 排列。
  • 比喻:想象你在一个巨大的乐高积木堆里,不改变每一块积木的颜色,而是改变积木的堆叠顺序
  • 为什么强韧:即使海浪(图片处理)把几块积木冲歪了,或者把颜色弄脏了,只要整体的堆叠顺序没乱,我们依然能认出这是“你的”积木堆。这就是为什么它抗干扰能力极强。

核心技巧二:载荷去偏随机化 (PDSR) —— “给积木换个摆放位置”

  • 问题:如果每次画"1"的时候,积木都堆在左上角,画"0"的时候都堆在右下角,那别人一眼就能看出规律,而且每次生成的画看起来都差不多(缺乏多样性)。
  • 做法:ShapeMark 在确定好积木顺序后,再随机地把整堆积木打散并重新随机摆放到画布的各个角落。
  • 比喻:就像你虽然规定了“红蓝红蓝”的排列顺序,但你可以把这串珠子随机撒在桌子的任何位置。
  • 好处
    1. 保多样性:每次生成的画,积木的位置都不同,看起来千变万化,保留了 AI 的创造力。
    2. 防暴露:别人看不出“水印”和“位置”的固定联系,更难发现水印的存在。
    3. 可还原:只有拥有“钥匙”(密钥)的人,才能知道怎么把积木重新拼回去,从而读出里面的顺序(水印)。

3. 怎么验证?

当有人拿着一张图来问:“这是不是 AI 生成的?是不是我生成的?”

  1. 逆向工程:验证者利用算法,尝试把这张图“还原”回最初的噪音状态(就像把画好的画退回到画布上的铅笔草稿)。
  2. 找顺序:虽然还原过程会有误差,但 ShapeMark 的“积木顺序”依然清晰可辨。
  3. 对暗号:验证者拿出自己的“钥匙”,看看还原出来的积木顺序是否符合预设的排列规则。如果符合,就证明这张图确实带有水印,且来源可信。

4. 总结:它厉害在哪里?

  • 像橡皮筋一样结实:无论图片被压缩、裁剪、加噪点还是模糊处理,水印都能被准确识别(论文数据显示,在极端干扰下,识别率依然高达 99% 以上)。
  • 像变色龙一样自然:它不会让 AI 生成的图片变得僵硬或重复,图片依然丰富多彩,看不出任何人工痕迹。
  • 像隐形墨水:它不需要修改 AI 模型本身,也不需要给图片后期加层滤镜,而是直接融入在生成的“基因”(噪音)里。

一句话总结
ShapeMark 就像是在 AI 绘画的“基因”里,用积木的排列顺序代替了积木的颜色来签名。即使积木被弄脏或打散,只要顺序还在,就能认出这是谁的作品,而且完全不影响画出来的画有多美、多多样。