Scaling Multilingual Semantic Search in Uber Eats Delivery

Uber Eats は、Qwen2 ベースの双塔モデルを大規模なクエリ - ドキュメント相互作用データで微調整し、Matryoshka 表現学習や多様な損失関数を活用して、店舗・料理・小売品といった多言語・多垂直分野にまたがる統合セマンティック検索システムを構築し、複数の市場で基線モデルを上回るリコール性能を達成した。

Bo Ling, Zheng Liu, Haoyang Chen, Divya Nagar, Luting Yang, Mehul Parsana

公開日 Wed, 11 Ma
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

Uber Eats の検索システムを、まるで**「巨大で賢い図書館の司書」**に例えて、わかりやすく解説します。

この論文は、Uber Eats が「お店」「料理」「スーパーの食材」など、あらゆるものを検索するときに使う、新しい「超・万能司書」を作った話です。

1. 昔のシステム:バラバラの司書たち

以前は、検索システムがバラバラでした。

  • 「お店」を探すときは、A さんの司書が担当。
  • 「料理」を探すときは、B さんの司書が担当。
  • 「スーパーの食材」を探すときは、C さんの司書が担当。

これでは、司書たちがそれぞれ別のルールで働いていて、管理が大変だし、ユーザーが「ピザ」と検索したときに、ピザ屋さんの「ピザ」と、スーパーの「冷凍ピザ」をうまく区別したり、関連付けたりするのが難しかったです。

2. 新しいシステム:一人の「超・万能司書」

今回 Uber Eats が導入したのは、**たった一人の「超・万能司書(AI モデル)」**です。
この司書は、世界中のあらゆる言語(英語、日本語、スペイン語など)を話し、お店・料理・食材のすべてを理解できます。

  • どんな入力でも理解する: ユーザーが「ピザ」と入力すると、司書は「あ、これは料理のピザか、それともピザ屋さんのことか?」と、文脈(国や言語)を考慮して瞬時に判断します。
  • 同じ「言葉のイメージ」で整理: 司書は、すべてのアイテムを「意味の地図(ベクトル空間)」という巨大な倉庫に整理します。意味が近いもの(例:「スパゲッティ」と「パスタ」)は、倉庫の中で隣同士に置かれます。

3. 司書を鍛える方法:2 段階のトレーニング

この司書をただの新人から、ベテランに育てるために、2 段階の厳しいトレーニングを行いました。

  1. 第 1 段階:膨大な履歴の学習(InfoNCE)
    • 何億もの「ユーザーが検索して、実際にクリックした履歴」を学習させます。「『寿司』と検索して『寿司屋』をクリックした」という事実を、ひたすら反復して覚えさせます。これで、基本的な検索の感覚が身につきます。
  2. 第 2 段階:難しい問題の克服(Triplet NCE)
    • ここがポイントです。AI にとって「迷うような難しい問題」を特別に作りました。
    • 例:「『パン』と検索したとき、フランスパン屋さんと、スーパーの食パン、どっちがユーザーの意図に近いのか?」
    • 高度な AI(LLM)に「これは正解、これは不正解」と厳しくチェックさせたデータを元に、「迷いやすいケース」を徹底的に練習させました。これにより、微妙なニュアンスの違いも理解できるようになりました。

4. 便利な機能:「ロシア人形(マトリョーシカ)」のような検索

このシステムには、**「マトリョーシカ(ロシア人形)」**のようなすごい仕組みがあります。

  • 大きさを選べる: 通常、検索結果を返すには「大きな人形(高品質なデータ)」を使いますが、スマホの通信が混雑しているときや、すぐに結果を出したいときは、「小さな人形(データを切り詰めたもの)」を使えます。
  • 1 つのモデルで全て: 昔は「小さい人形用」「大きい人形用」と別々のモデルを用意していましたが、今は1 つのモデルで、状況に合わせて「128 次元」「256 次元」「1536 次元」と、必要な大きさだけを取り出して使えます。
    • メリット: 倉庫のスペース(ストレージコスト)が激減し、検索も爆速になります。

5. 結果:どれくらい良くなった?

この新しいシステムを導入した結果、以下のような劇的な変化がありました。

  • 見つけやすさの向上: 昔のシステムに比べ、「お店」の検索で見つかる確率が最大で 88% 向上しました。「探しているものが、検索結果のトップにちゃんと並ぶ」ようになりました。
  • 言語の壁の突破: 日本や台湾など、以前は検索精度が低かった国でも、大幅に改善されました。
  • コストと速度の両立: 検索の精度を落とさずに、データ保存コストを96% 削減(100 分の 4 まで)することに成功しました。まるで、同じ量の荷物を、もっと小さいトラックで運べるようになったようなものです。

まとめ

この論文は、Uber Eats が**「バラバラだった検索システムを、一人の天才的な万能司書に統一し、何億ものデータで鍛え上げ、さらに状況に合わせてサイズを変えられるようにした」**という、画期的な技術の成功物語です。

おかげで、ユーザーは「何か食べたい」と検索したとき、より早く、より正確に、自分の好みの料理やお店を見つけられるようになったのです。