When & How to Write for Personalized Demand-aware Query Rewriting in Video Search

本論文は、動画検索におけるユーザーの意図特定と曖昧さ解消を目的として、個人化の必要性を自動判定する「いつ書き換えるか」、LLM と検索システムの整合性を高めるハイブリッド学習手法による「どのように書き換えるか」、そして低遅延な展開を実現する「Fake Recall」アーキテクチャを提案し、オンライン実験でクリック率向上とクエリ再定式化率の低下を確認した「WeWrite」というパーソナライズされた需要意識型クエリ書き換えフレームワークを紹介しています。

Cheng cheng, Chenxing Wang, Aolin Li, Haijun Wu, Huiyun Hu, Juyuan Wang

公開日 2026-02-23
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

🍽️ 料理の注文と「WeWrite」の仕組み

想像してください。あなたがレストラン(動画検索サイト)に入りました。

1. 従来の検索の悩み:曖昧な注文

あなたが「光良(コウリョウ)」と注文しました。

  • 従来の店員(検索エンジン)は、「光良」という言葉だけで判断します。「歌手の光良さんですか?それとも、お酒の『光良』ですか?」と迷ってしまい、両方の料理(動画)を並べて出します。
  • 問題点: あなたが実は「お酒」を探していたのに、歌手の動画ばかり出てきてガッカリしたり、逆に歌手を探していたのにお酒の動画ばかり出てきて「違う!」とまた注文し直したりします。これを「検索のやり直し(リフォーマル)」と呼びます。

2. 新しい仕組み「WeWrite」の登場

この論文で紹介されている**「WeWrite」というシステムは、「賢い注文係(コンシェルジュ)」**のようなものです。

このコンシェルジュは、あなたの**「過去の行動履歴」**(以前何を食べたか、どこにいたか)を覚えていて、注文内容を自動的に補正してくれます。

  • あなたの履歴: 「以前、焼肉屋で『光良』というお酒を注文して、とても満足して長くとどまっていた」
  • コンシェルジュの判断: 「あ、この人は歌手ではなく、お酒の『光良』を探しているんだな!」
  • 自動修正: あなたが「光良」と注文した瞬間、コンシェルジュが裏で**「光良 焼酎」「光良 銘柄」**というより具体的な注文に書き換えて、厨房(検索エンジン)に伝えます。
  • 結果: あなたが求めているお酒の動画が、最初からズバリ表示されます。

🔑 このシステムが解決した 3 つの大きな課題

この「賢いコンシェルジュ」を作るには、3 つの難しい壁を越える必要がありました。

① 「いつ」書き換えるべきか?(When to Write)

課題: 何でもかんでも書き換えると、逆に混乱します。

  • : あなたが「空気清浄機」と検索した場合、これは「掃除機が欲しい」という明確な機能の注文です。これを「過去の趣味(お笑い動画)」に合わせて「空気清浄機で笑えるネタ」に変えたら、ユーザーは怒ります(これを「意図の逸脱」と呼びます)。
  • 解決策: コンシェルジュは、**「ユーザーが最初の注文で満足しなかった時だけ」**介入します。
    • 最初の検索で「すぐに離れてしまった(動画を見なかった)」→「あ、間違えてたな。書き換えよう!」
    • 最初の検索で「満足して長く見ていた」→「そのままの注文で OK。書き換え不要!」
    • この「書き換えるべきタイミング」を、過去のデータから自動で学習させました。

② 「どう」書き換えるべきか?(How to Write)

課題: いくら意味が通じても、検索システムが「その言葉」を認識していないと、何も出てきません。

  • : コンシェルジュが「光良の最高に美味しいお酒」という素敵な文章を生成しても、検索システムが「光良 最高 美味しい」という言葉を登録していなければ、結果はゼロです。
  • 解決策: 2 段階のトレーニングを行いました。
    1. SFT(教師あり学習): 「過去の成功例」を見て、どう書き換えるかを基本教えます。
    2. GRPO(強化学習): 「検索システムにヒットしやすい言葉」を選ぶように、**「正解の報酬」**を与えて訓練します。「検索結果がたくさん出る言葉」や「クリックされる言葉」を生成するように、AI の癖をシステムに合わせました。

③ 「遅延」をどう防ぐか?(Deployment)

課題: 賢いコンシェルジュは考えるのに時間がかかります。注文から料理が出るまで待たされると、ユーザーはイライラします。

  • 解決策: **「並行して動く『偽の在庫』」**という仕組みを使いました。
    • 通常、検索結果を出すには時間がかかります。
    • しかし、WeWrite は**「メインの検索」と同時に、裏で「AI が考えた新しい言葉」で検索**を始めています。
    • さらに、**「よくある検索結果のリスト(偽の在庫)」**を事前に用意しておき、AI が考えた言葉がこれに合致すれば、即座に結果を返します。
    • ユーザーは「待たされた」と感じることなく、瞬時に最適な動画が表示されます。

🏆 実際の効果

このシステムを実際の巨大な動画プラットフォーム(微信チャンネルなど)でテストしたところ、素晴らしい結果が出ました。

  • 動画視聴時間の増加: ユーザーが「10 秒以上」動画を見てくれる回数が1.07% 増えました
  • 検索のやり直し減少: ユーザーが「あれ?違うな」と思って検索ワードを修正する回数が2.97% 減りました

まとめ

この論文は、**「ユーザーの過去の行動をヒントに、AI が『今、あなたが本当に求めているもの』を推測して、検索ワードを自動で補正する」**という仕組みを提案しています。

  • いつやるか: ユーザーが不満を持っている時だけ。
  • どうやるか: 検索システムに合った言葉で、かつユーザーの好みに合うように。
  • どう速くするか: 並行処理と事前準備で、待ち時間ゼロを実現。

これにより、ユーザーは「自分が探している動画」を、より早く、より正確に見つけることができるようになりました。

このような論文をメールで受け取る

あなたの興味に合わせた毎日または毎週のダイジェスト。Gistまたは技術要約を、あなたの言語で。

Digest を試す →