BLM-Guard: Explainable Multimodal Ad Moderation with Chain-of-Thought and Policy-Aligned Rewards

本論文は、Chain-of-Thought 推論、ルールベースのポリシー原則、およびクリティックガイド型報酬を融合し、合成データと強化学習を活用して短編動画広告の多モーダルな誤表示を検出・説明する新フレームワーク「BLM-Guard」を提案するものである。

Yiran Yang, Zhaowei Liu, Yuan Yuan, Yukun Song, Xiong Ma, Yinghao Song, Xiangji Zeng, Lu Sun, Yulu Wang, Hai Zhou, Shuai Cui, Zhaohan Gong, Jiefei Zhang

公開日 2026-02-24
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

🛒 背景:なぜ新しい「検査員」が必要なの?

今や TikTok や Instagram などのショート動画では、誰でも簡単に「視覚(映像)+音声+文字」を組み合わせた広告を作れます。
しかし、これが問題なんです。

  • 一般的な動画の監視: 「暴力」や「ヌード」のような、**「明らかに悪いこと」**を見つけるのが主な仕事でした。
  • 広告の監視: 「嘘をついている」「誇張しすぎている」「法律に違反している」といった、**「こっそり隠れた悪いこと」**を見つける必要があります。

例えば、「無料の高級スマホ」と言っているのに、実際は「クリックしたら有料になる」とか、「健康にいい」と言いつつ「怪しい成分」が含まれているような、**「映像は benign(無害)なのに、音声や字幕で嘘をついている」**ようなケースです。

既存の AI は、この「微妙な嘘」や「映像と言葉の不一致」を見抜くのが苦手でした。

🕵️‍♂️ BLM-Guard の正体:3 つの超能力を持つ「天才検査員」

この論文で提案されている「BLM-Guard」は、ただの AI ではなく、**「3 つの超能力」**を持った天才的な検査員です。

1. 「思考のメモ」を書く癖(Chain-of-Thought)

普通の AI は「はい、違反です!」と即答してしまいますが、BLM-Guard は**「思考のメモ(CoT)」**を必ず書きます。

  • 例: 「映像では『無料』と言っているが、字幕には『条件付き』と書いてあるな。これは『言葉と映像の不一致』だ。だから『詐欺まがいの広告』と判断しよう。」
    このように、「なぜそう判断したか」を論理的に説明することで、人間が納得できるようにしています。

2. 「ルールブック」を頭に入れて、練習する(ICoT & SFT)

いきなり本番で検査するのは難しいので、まずは**「ルールブック(プラットフォームの規約)」**を徹底的に勉強させます。

  • 工夫: 人間が一つ一つラベルをつけるのは大変なので、AI が「もしこんな映像が出たら、このルールに当てはまる」という**「練習用データ」**を自動で大量に作ります。
  • これにより、AI は「どんなパターンが違反なのか」を、ルールに基づいて深く理解した状態でスタートできます。

3. 「批評家」に褒められながら成長する(強化学習 & 報酬)

練習が終わったら、本番に近い環境で**「強化学習(RL)」**を行います。ここで重要なのが「報酬(ご褒美)」の仕組みです。

  • ただ正解するだけじゃダメ: 「違反を見つけた」だけでなく、**「その理由の説明が論理的か」「ルールに忠実か」**まで評価されます。
  • 批評家の役割: AI の回答に対して、もう一人の AI(批評家)が「この説明は少し飛躍しすぎている」「この判断はルールと合っていない」と**「自己一致(Self-Consistency)」**をチェックします。
  • AI はこの批評を聞いて、「次はもっと論理的に説明しよう」と自ら修正しながら、どんどん上手になっていきます。

🧪 結果:どんなにすごいのか?

この「BLM-Guard」をテストしたところ、以下の結果になりました。

  • 精度が段違い: 既存の AI よりも、嘘や誇張を見抜く精度が圧倒的に高いです。
  • どんな動画でも通用する: 特定のジャンルだけでなく、暴力やフェイクニュースなど、他の分野のデータでも活躍しました。
  • 説明が上手: 「なぜ違反なのか」を人間が理解できる形で説明できるので、運営側も納得して処理できます。

🎯 まとめ:どんな風に役立つ?

この技術は、**「AI が人間の代わりに、広告の『こっそりした嘘』を見抜き、その理由を論理的に説明してくれる」**というものです。

まるで、**「ただの警備員」ではなく、「法廷で証言できるほどの論理力を持った、熟練した検察官」**が、24 時間体制で動画をチェックしてくれるようなイメージです。

これにより、ユーザーはより安全で信頼できる広告を見ることができ、企業もルールを正しく守れるようになります。

このような論文をメールで受け取る

あなたの興味に合わせた毎日または毎週のダイジェスト。Gistまたは技術要約を、あなたの言語で。

Digest を試す →