Each language version is independently generated for its own context, not a direct translation.
🍽️ 料理の注文と「WeWrite」の仕組み
想像してください。あなたがレストラン(動画検索サイト)に入りました。
1. 従来の検索の悩み:曖昧な注文
あなたが「光良(コウリョウ)」と注文しました。
- 従来の店員(検索エンジン)は、「光良」という言葉だけで判断します。「歌手の光良さんですか?それとも、お酒の『光良』ですか?」と迷ってしまい、両方の料理(動画)を並べて出します。
- 問題点: あなたが実は「お酒」を探していたのに、歌手の動画ばかり出てきてガッカリしたり、逆に歌手を探していたのにお酒の動画ばかり出てきて「違う!」とまた注文し直したりします。これを「検索のやり直し(リフォーマル)」と呼びます。
2. 新しい仕組み「WeWrite」の登場
この論文で紹介されている**「WeWrite」というシステムは、「賢い注文係(コンシェルジュ)」**のようなものです。
このコンシェルジュは、あなたの**「過去の行動履歴」**(以前何を食べたか、どこにいたか)を覚えていて、注文内容を自動的に補正してくれます。
- あなたの履歴: 「以前、焼肉屋で『光良』というお酒を注文して、とても満足して長くとどまっていた」
- コンシェルジュの判断: 「あ、この人は歌手ではなく、お酒の『光良』を探しているんだな!」
- 自動修正: あなたが「光良」と注文した瞬間、コンシェルジュが裏で**「光良 焼酎」や「光良 銘柄」**というより具体的な注文に書き換えて、厨房(検索エンジン)に伝えます。
- 結果: あなたが求めているお酒の動画が、最初からズバリ表示されます。
🔑 このシステムが解決した 3 つの大きな課題
この「賢いコンシェルジュ」を作るには、3 つの難しい壁を越える必要がありました。
① 「いつ」書き換えるべきか?(When to Write)
課題: 何でもかんでも書き換えると、逆に混乱します。
- 例: あなたが「空気清浄機」と検索した場合、これは「掃除機が欲しい」という明確な機能の注文です。これを「過去の趣味(お笑い動画)」に合わせて「空気清浄機で笑えるネタ」に変えたら、ユーザーは怒ります(これを「意図の逸脱」と呼びます)。
- 解決策: コンシェルジュは、**「ユーザーが最初の注文で満足しなかった時だけ」**介入します。
- 最初の検索で「すぐに離れてしまった(動画を見なかった)」→「あ、間違えてたな。書き換えよう!」
- 最初の検索で「満足して長く見ていた」→「そのままの注文で OK。書き換え不要!」
- この「書き換えるべきタイミング」を、過去のデータから自動で学習させました。
② 「どう」書き換えるべきか?(How to Write)
課題: いくら意味が通じても、検索システムが「その言葉」を認識していないと、何も出てきません。
- 例: コンシェルジュが「光良の最高に美味しいお酒」という素敵な文章を生成しても、検索システムが「光良 最高 美味しい」という言葉を登録していなければ、結果はゼロです。
- 解決策: 2 段階のトレーニングを行いました。
- SFT(教師あり学習): 「過去の成功例」を見て、どう書き換えるかを基本教えます。
- GRPO(強化学習): 「検索システムにヒットしやすい言葉」を選ぶように、**「正解の報酬」**を与えて訓練します。「検索結果がたくさん出る言葉」や「クリックされる言葉」を生成するように、AI の癖をシステムに合わせました。
③ 「遅延」をどう防ぐか?(Deployment)
課題: 賢いコンシェルジュは考えるのに時間がかかります。注文から料理が出るまで待たされると、ユーザーはイライラします。
- 解決策: **「並行して動く『偽の在庫』」**という仕組みを使いました。
- 通常、検索結果を出すには時間がかかります。
- しかし、WeWrite は**「メインの検索」と同時に、裏で「AI が考えた新しい言葉」で検索**を始めています。
- さらに、**「よくある検索結果のリスト(偽の在庫)」**を事前に用意しておき、AI が考えた言葉がこれに合致すれば、即座に結果を返します。
- ユーザーは「待たされた」と感じることなく、瞬時に最適な動画が表示されます。
🏆 実際の効果
このシステムを実際の巨大な動画プラットフォーム(微信チャンネルなど)でテストしたところ、素晴らしい結果が出ました。
- 動画視聴時間の増加: ユーザーが「10 秒以上」動画を見てくれる回数が1.07% 増えました。
- 検索のやり直し減少: ユーザーが「あれ?違うな」と思って検索ワードを修正する回数が2.97% 減りました。
まとめ
この論文は、**「ユーザーの過去の行動をヒントに、AI が『今、あなたが本当に求めているもの』を推測して、検索ワードを自動で補正する」**という仕組みを提案しています。
- いつやるか: ユーザーが不満を持っている時だけ。
- どうやるか: 検索システムに合った言葉で、かつユーザーの好みに合うように。
- どう速くするか: 並行処理と事前準備で、待ち時間ゼロを実現。
これにより、ユーザーは「自分が探している動画」を、より早く、より正確に見つけることができるようになりました。
このような論文をメールで受け取る
あなたの興味に合わせた毎日または毎週のダイジェスト。Gistまたは技術要約を、あなたの言語で。