SIGMark: Scalable In-Generation Watermark with Blind Extraction for Video Diffusion

SIGMark は、大規模なメッセージキーの保存を不要とする盲抽出機能と、時系列擾乱に対する頑健性を向上させるモジュールを備えた、拡散モデルによる動画生成向けのスケーラブルかつ歪みのない透かし埋め込みフレームワークを提案するものです。

Xinjie Zhu, Zijing Zhao, Hui Jin, Qingxiao Guo, Yilong Ma, Yunhao Wang, Xiaobing Guo, Weifeng Zhang

公開日 2026-03-04
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

SIGMark: AI 動画の「見えない透かし」を、誰でも簡単に探す方法

この論文は、**「AI が作った動画に、誰が作ったか(あるいはそれが AI 製か)を証明する『見えない透かし』を、動画を作っている最中に埋め込む」**という新しい技術について書かれています。

従来の方法には大きな問題がありましたが、この「SIGMark」という新しい仕組みは、それをすべて解決する画期的なアイデアです。

以下に、専門用語を使わず、身近な例え話で解説します。


1. 今までの「透かし」には 2 つの大きな弱点があった

AI が作った動画に透かしを入れるには、大きく分けて 2 つの方法がありました。しかし、どちらも「大規模に使う」には難点がありました。

弱点①:後からつける方法(ポストプロセッシング)

  • 例え話: 料理が完成した後に、無理やり「塩」を振りかけるようなものです。
  • 問題点: 動画の画質が落ちてしまいます。透かしを入れるために画像をいじると、元の美しい映像が少し汚れてしまうのです。

弱点②:作っている最中につける方法(イン・ジェネレーション)

  • 例え話: 料理を作る前に、鍋の中に「魔法の種」を混ぜておき、完成した料理にその魔法の味が染み込むようにする方法です。これは画質を落とさずに透かしを入れられます。
  • 問題点: **「鍵の管理が大変すぎる」**ことでした。
    • 今までの技術では、透かしを入れるたびに「この動画には A という鍵を使いました」という記録を全部保存しておく必要がありました。
    • 動画を検索するときは、「この動画の鍵は A かな?それとも B かな?」と、保存した何万もの鍵と一つずつ照合(マッチング)しなくてはいけませんでした。
    • 動画が増えれば増えるほど、検索にかかる時間とコストが爆発的に増え、実用性がありませんでした。

2. SIGMark のすごいところ:3 つの魔法

この論文で提案された**「SIGMark」**は、上記の弱点をすべて解決する 3 つの魔法を持っています。

魔法①:「全員共通の鍵」を使う(盲検出・Blind Extraction)

  • 仕組み: 従来のように「動画ごとに違う鍵」を使うのではなく、**「世界共通の鍵(GF-PRC)」**を一つだけ持っておくことにしました。
  • 例え話: 従来の方法は、それぞれの家(動画)に「個別の鍵」を配り、探すときは「この鍵が A 家のものか、B 家のものか」を全部チェックしていました。
    • SIGMark は、**「すべての家に共通の『魔法の紋章』を刻んでおく」**という方法です。
    • 探すときは、その紋章があるかどうかを調べるだけでいいので、**何万個の動画があっても、検索にかかる時間は「一定」**で済みます。これが「スケーラビリティ(拡張性)」の正体です。

魔法②:「時間軸の乱れ」を直す(SGO モジュール)

  • 仕組み: 現代の AI 動画生成モデルは、動画を「4 フレームずつ」のグループでまとめて作ります。しかし、動画が圧縮されたり、フレームが削除されたりすると、このグループの順番がバラバラになります。
  • 例え話: 本をページ順に並べて読もうとしたのに、ページが抜けていたり、裏返っていたりすると、話が通じません。
    • SIGMark は、「動きの流れ(オプティカルフロー)」を見て、「あ、ここは 4 ページのセットの始まりだ!」と自動的に見つけ出し、正しい順番に並べ直す機能を持っています。
    • これにより、動画が少し壊れても、透かしを正しく読み取ることができます。

魔法③:画質はそのまま(歪みなし)

  • 仕組み: 透かしを入れるために、動画のノイズ(雑音)の性質を少しだけ変えるだけで済みます。
  • 例え話: 水にインクを一滴垂らしても、水の色はほとんど変わりません。
    • この技術は、AI が動画を作る「最初のノイズ」に透かしを埋め込むため、完成した動画の画質は、透かしを入れていない場合と全く同じです。

3. まとめ:なぜこれが重要なのか?

この「SIGMark」は、AI 動画が爆発的に増える未来において、**「安全で、高品質で、かつ誰でも管理できる」**透かし技術を実現しました。

  • 画質は落ちない(魔法の種を混ぜるだけ)。
  • 検索が爆速(共通の鍵を使うので、何万本あっても一瞬)。
  • 壊れた動画でも読める(ページを自動で並べ直す)。

これにより、AI が作った動画がどこから来たか(著作権の保護)や、悪意のある動画の追跡が、大規模なプラットフォームでも現実的に可能になります。まるで、**「世界中の AI 動画に、見えないが確実に追跡できる『魔法の指紋』を、一瞬で埋め込むシステム」**が完成したようなものです。