ShapeMark: Robust and Diversity-Preserving Watermarking for Diffusion Models

この論文は、拡散モデルの出力に対する知的財産保護の課題に対し、ノイズの構造パターンに透かし情報を符号化し、かつノイズ要素の位置をランダム化することで、既存手法の弱点であった頑健性と生成多様性の両立を実現する「ShapeMark」という新しい透かし手法を提案しています。

Yuqi Qian, Yun Cao, Haocheng Fu, Meiyang Lv, Meineng Zhu

公開日 Wed, 11 Ma
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

シェイプマーク(ShapeMark):AI 画像の「見えない指紋」を強く、そして多様に保つ新技術

この論文は、最近流行している「AI 画像生成(拡散モデル)」の著作権保護と、その画像が誰によって作られたかを証明するための新しい技術「シェイプマーク(ShapeMark)」について説明しています。

難しい専門用語を使わず、**「お菓子作り」「パズル」**の例えを使って、この技術が何をしているのか、なぜ素晴らしいのかを解説します。


1. 背景:AI 画像の「誰が作ったか」問題

AI は素晴らしい絵を描くことができますが、そのせいで「この画像は本当に AI が作ったのか?」「誰の許可なく使われているのか?」という問題が起きています。
そこで、画像の中に**「見えない透かし(ウォーターマーク)」**を入れる技術が必要とされています。

しかし、これまでの技術には大きな弱点がありました。

  • 弱すぎる: 画像を少し加工(リサイズや圧縮)されただけで、透かしが消えてしまう。
  • 画質が落ちる: 透かしを入れると、AI が描く絵の「多様性(バリエーション)」が減って、似たような絵ばかりになってしまう。

2. 従来の技術の弱点:「値(値)」に頼りすぎている

これまでの透かし技術は、**「個々の数字の値」**に情報を埋め込んでいました。

  • 例え: 画像を作るための「材料(ノイズ)」を並べたとき、「1 番目の材料は赤、2 番目は青」というように、**「色そのもの」**で情報を伝えます。
  • 問題点: 画像が加工されると、その「色」が少しずれてしまいます(例:赤が少しオレンジになる)。すると、「これは赤だったはずなのに、オレンジになったから透かしが消えた」と判断されてしまい、失敗します。

3. シェイプマークの解決策:「形(構造)」で情報を伝える

シェイプマークは、**「個々の値」ではなく「配置の形」**に情報を埋め込むという、全く新しいアプローチをとっています。

① 構造エンコーディング(SE):パズルの並び順で伝える

  • アイデア: 材料(ノイズ)の「色そのもの」は変えずに、**「どの材料をどこに置くか」という順番(配置の形)**だけで情報を伝えます。
  • 例え:
    • 100 個のレゴブロックがあるとします。
    • 従来の方法:「赤いブロックを 1 番目に置く」→ 赤が少し色あせると情報が消える。
    • シェイプマーク:「赤いブロックを 1 番目に置く」のではなく、**「赤いブロックを『左側』のグループに入れ、青いブロックを『右側』のグループに入れる」という「グループの並び順」**で情報を伝えます。
  • メリット: 画像が加工されてブロックの色が少し変わっても、「左側と右側のグループ分け」は崩れないため、透かしを正しく読み取ることができます。これが**「頑丈さ(ロバストネス)」**の秘密です。

② ペイロード・デバイアス構造ランダム化(PDSR):同じ絵が繰り返されないようにする

  • 問題: 従来の方法では、同じ情報(透かし)を入れると、AI がいつも同じ場所に同じパターンのノイズを配置してしまい、生成される画像が「似通ったもの」ばかりになってしまいます(多様性の低下)。
  • 解決策: シェイプマークは、情報を埋め込んだ後、**「パズルのピースの位置を、その画像ごとにランダムにシャッフル」**します。
  • 例え:
    • 同じ「秘密のメッセージ」を伝えるために、いつも同じ配置のレゴを使うのではなく、「その日その時の天気(公開鍵)」に合わせて、ブロックの並びをランダムに混ぜます。
    • 結果:同じメッセージでも、毎回全く違う配置(ノイズ)になり、AI が描く絵も毎回新鮮で多様になります。
  • メリット: 透かしが入っていても、画像の「多様性」や「美しさ」が損なわれません。

4. 結果:最強のバランス

実験の結果、シェイプマークは以下の素晴らしい性能を示しました。

  • 超頑丈: 画像を激しく加工(JPEG 圧縮、ノイズ追加、切り抜きなど)しても、99% 以上の確率で透かしを読み取れます。
  • 高品質: 画像の美しさや、AI が描く絵のバリエーション(多様性)は、透かしを入れない場合とほとんど変わりません。
  • 大容量: 多くの情報(256 ビットなど)を埋め込んでも、上記の性能を維持できます。

まとめ

シェイプマークは、AI 画像に「見えない指紋」を入れる技術の進化形です。

  • 従来の技術が**「色(値)」**に頼っていたのに対し、
  • シェイプマークは**「配置の形(構造)」「ランダムなシャッフル」を使うことで、「加工に強く」かつ「画質や多様性を保つ」**という、これまで不可能だった両立を実現しました。

これにより、AI が作った画像の著作権保護や、どこで誰が作ったかの追跡が、現実世界でより実用的になることが期待されています。