Generative Recommendation for Large-Scale Advertising

快手の広告システム向けに、ユニファイド広告セマンティックID、レイジー自己回帰デコーダ、価値感知教師あり学習、ランキング指向ソフトマックス選好最適化、および動的ビームサービングを統合した生成型推薦モデル「GR4AD」を提案し、大規模オンラインテストで既存の DLRM ベースのシステムに対し最大 4.2% の広告収益向上を実現したことを報告する論文です。

Ben Xue, Dan Liu, Lixiang Wang, Mingjie Sun, Peng Wang, Pengfei Zhang, Shaoyun Shi, Tianyu Xu, Yunhao Sha, Zhiqiang Liu, Bo Kong, Bo Wang, Hang Yang, Jieting Xue, Junhao Wang, Shengyu Wang, Shuping Hui, Wencai Ye, Xiao Lin, Yongzhi Li, Yuhang Chen, Zhihui Yin, Quan Chen, Shiyang Wen, Wenjin Wu, Han Li, Guorui Zhou, Changcheng Li, Peng Jiang

公開日 2026-03-05
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

快手(Kuaishou)の「広告生成 AI」がどうやって大成功を収めたか

~「GR4AD」という新しい魔法のレシピ~

この論文は、中国の巨大動画プラットフォーム「快手(Kuaishou)」が、「生成 AI」を使って広告をより賢く、速く、そして儲かるようにするための新しいシステム「GR4AD」を開発したというお話しです。

従来のシステムが「過去のデータから似たものを探す」ような働きだったのに対し、この新しいシステムは**「ゼロから新しいアイデアを創造する」**ような働きをします。

専門用語を抜きにして、3 つの重要な工夫(魔法)を使って、どんな仕組みなのかを解説します。


1. 広告の「名前」を新しくつけた(UA-SID)

【比喩:本屋の整理法】

従来のシステムは、広告を「ID 番号(1 番、2 番、3 番…)」で管理していました。これだと、同じ商品でも名前が違うと別物になってしまい、新しい商品(コールドスタート)がおすすめされにくくなります。

GR4AD は、**「意味のある名前(Semantic ID)」**を付けました。

  • どんな名前? 「夏場のビーチで飲む冷たいコーラ」や「子供向けのおもちゃ」のように、広告の内容や特徴を言葉で理解した上で、短いコード(ID)に変換します。
  • 魔法のテクニック:
    • AI 先生に教える(Instruction Tuning): AI に「この動画の主人公は誰?」「どんな商品が売りたいの?」と質問して、広告の本当の姿を理解させました。
    • 衝突防止(MGMR): 同じような商品が大量に存在すると、名前が被ってしまいます。そこで、「大きな箱(上位)」と「小さな箱(下位)」を組み合わせるような工夫をして、どの箱も無駄なく使えるようにしました。

結果: 広告の「顔」がはっきりし、ユーザーにぴったり合う広告を見つけやすくなりました。

2. 考えるスピードを劇的にアップ(LazyAR)

【比喩:料理の工程】

生成 AI は通常、**「1 文字ずつ順番に考えて」**文章(ここでは広告のリスト)を作ります。これを「自動回帰」と言いますが、1 文字ずつ考えるのは時間がかかります。

GR4AD は、**「LazyAR(怠け者自動回帰)」**という新しい考え方を導入しました。

  • どうやって?
    • 最初の数文字(最初の 2〜3 行)は、慎重に丁寧に考えます。ここが一番重要だからです。
    • しかし、その後の部分は**「最初の数文字の考え方をベースに、並行して一気に考えます」**。
    • 例えるなら: 料理の「下準備(野菜を切る)」は丁寧にしますが、メインの「炒める」工程は、複数の鍋を同時に使って一気に済ませるようなものです。
  • 効果: 品質を落とさずに、処理速度を 2 倍にしました。これにより、1 秒間に 500 人以上のユーザーに瞬時に広告を提示できるようになりました。

3. 「儲かる順」に並び替える学習(VSL & RSPO)

【比喩:優秀な店員のトレーニング】

AI に「広告を出せ」と言っても、ただランダムに出すだけでは意味がありません。「クリックされやすい順」や「お金になる順」に並べる必要があります。

GR4AD は、2 つのトレーニング方法を組み合わせています。

  1. VSL(価値を知る学習): 「ユーザーが何を好むか」を過去のデータから学びます。
  2. RSPO(ランキングの魔法): 単に「正解」を教えるだけでなく、**「このリストの順番が、利益(eCPM)を最大化する順番か?」**という視点で、AI 自身に「もっと良い順番を考え直せ!」と指導します。

魔法の仕組み:

  • AI が「あ、この順番だと利益が出ないな」と気づいたら、すぐに修正します。
  • さらに、「混雑している時」と「暇な時」で、考える量(ビーム幅)を自動調整します。
    • 混雑時: 速さを優先して、必要な分だけ考える。
    • 暇な時: 時間をかけて、より良いアイデアをたくさん探して、リストの質を高める。

実際の成果:どれくらいすごいのか?

このシステムを実際の快手(Kuaishou)の広告システム(4 億人以上のユーザー)に導入したところ、驚くべき結果が出ました。

  • 広告収入が最大 4.2% 増加: 既存のシステムと比べて、これだけ儲かるようになりました。
  • スピードも速い: 1 回の広告表示に 100 ミリ秒(0.1 秒)以下で応答。
  • すべての関係者がハッピー:
    • ユーザー: 興味のある広告しか見なくなるので、ストレスが減りました。
    • 広告主: 特に中小企業の広告が、より多くの人に見られるようになりました。
    • プラットフォーム: 収益が上がり、システムも安定しました。

まとめ

GR4AD は、「広告の理解力(UA-SID)」「思考のスピード(LazyAR)」、そして**「利益を最大化する判断力(RSPO)」**をすべて組み合わせた、実用性の高い AI です。

「生成 AI」が単なるチャットボットや絵描きだけでなく、**「大規模なビジネスの現場で、リアルタイムに価値を生み出す」**ことができることを証明した、画期的な研究と言えます。