RandMark: On Random Watermarking of Visual Foundation Models

本論文では、視覚基盤モデルの所有権検証を目的として、保持用データセットの内部表現にランダムなデジタル透かしを埋め込むエンコーダ・デコーダネットワークを提案し、理論的および実験的に、透かしが埋め込まれたモデルとそうでないモデルを高い精度で識別できることを示しています。

Anna Chistyakova, Mikhail Pautov

公開日 2026-03-12
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

🎨 1. 背景:なぜ「透かし」が必要なの?

まず、**「Visual Foundation Model(視覚の基礎モデル)」とは何でしょうか?
これは、AI が「絵」や「写真」を理解するために、何百万枚もの画像を勉強して作られた
「超優秀な下書き用キャンバス」**のようなものです。

  • 価値: これを作るには、莫大なお金と時間がかかります。
  • 問題: 所有者は、このキャンバスをライセンス(使用権)として販売したり、サブスクリプションで提供したりします。
  • リスク: しかし、悪意のある人が「このキャンバスをコピーして、自分のサービスで勝手に使おう」としたり、「中身を少し変えて(微調整して)自分のものだと主張しよう」としたりする可能性があります。

そこで必要なのが**「透かし(Watermarking)」**です。
これは、絵画に画家が「これは私の作品だ」という目に見えないサインを隠しておくようなものです。

🕵️‍♂️ 2. 従来の方法の限界

これまでの透かし技術は、主に「分類モデル(猫か犬かを判別する AI)」向けに作られていました。
しかし、今回の「基礎モデル」は、猫や犬だけでなく、画像の分割、特徴抽出など、あらゆるタスクに使える万能なモデルです。
従来の方法だと、この万能モデルを少し変える(微調整する)だけで、透かしが消えてしまったり、逆に無関係なモデルまで「自分の透かしが入っている」と誤判定したりする問題がありました。

💡 3. RandMark の仕組み:「ランダムな変形」を使った魔法

この論文が提案する**「RandMark」**という方法は、以下のような仕組みで動きます。

🧩 比喩:「変形したパズル」で認証する

Imagine(想像してみてください):

  1. 秘密のメッセージ: 所有者は「123456」という短いパスワード(透かし)を決めます。
  2. トリガー画像: 特定の画像(例:リンゴの絵)を用意します。
  3. ランダムな変形: このリンゴの絵に、AI が「ノイズ(ざらざらした砂)」を少し混ぜたり、色を少しずらしたりします。これを**「ランダムな変形」**と呼びます。
    • 重要なのは、**「同じリンゴでも、変形の仕方は毎回少し違う」**ということです。
  4. 埋め込み: AI(基礎モデル)に、この「変形したリンゴ」を見せながら、「この画像の内部には『123456』というメッセージが隠れている」と教えます。
  5. 検証: 後で、誰かが「この AI は私のものか?」と疑われたとき、同じ「変形したリンゴ」を AI に見せます。
    • もしその AI が元のモデルの「コピー(機能的な複製)」なら、「変形のパターン」に合わせて、同じ『123456』というメッセージを出力するはずです。
    • もし全く別の AI(無関係なモデル)なら、変形された画像を見ても、でたらめなメッセージしか出せません。

🌟 すごいところ:「ランダム性」が鍵

従来の透かしは「特定の画像」に透かしを埋め込むことが多かったですが、RandMark は**「ランダムな変形」を使います。
これにより、AI が「微調整(Fine-tuning)」されてタスクを変えたり、不要な部分を「剪定(Pruning)」されて軽量化されたりしても、
「変形された画像に対する反応(メッセージの出力)」という関係性が保たれる**ため、透かしが消えません。

🛡️ 4. 実験結果:どれくらい強いのか?

著者たちは、最新の AI モデル(CLIP や DINOv2)を使って実験しました。

  • タスク変更: 画像分類や画像分割(ピクセル単位で物を区切る作業)用に AI を訓練し直しても、透かしは90% 以上の確率で発見できました。
  • 剪定(軽量化): AI の中身を 20%〜40% も削って軽くしても、透かしは消えませんでした
  • 誤判定: 全く別の AI を「自分の透かしが入っている」と誤って判定してしまうことは、ほとんどありませんでした。

📝 まとめ:なぜこれが重要なのか?

この「RandMark」は、**「AI の著作権を守る新しい盾」**です。

  • 従来: 「AI を少し変えたら、透かしが消えてしまう」→ 悪用されやすい。
  • RandMark: 「AI をどんなに変えても(分類用に変えても、軽量化しても)、『変形された画像』に対する反応という関係性が残る」→ 強く、確実。

つまり、AI の開発者は、自分の作った「基礎モデル」が勝手にコピーされて使われても、「あ、これは私の透かしが入ったコピーだ!」と、どんな形に変えられたモデルでも見破れるようになるのです。

これは、AI 業界が成熟し、知的財産を守るための重要な一歩となる技術です。