Scaling Multilingual Semantic Search in Uber Eats Delivery

Each language version is independently generated for its own context, not a direct translation.

Uber Eats の検索システムを、まるで**「巨大で賢い図書館の司書」**に例えて、わかりやすく解説します。

この論文は、Uber Eats が「お店」「料理」「スーパーの食材」など、あらゆるものを検索するときに使う、新しい「超・万能司書」を作った話です。

1. 昔のシステム：バラバラの司書たち

以前は、検索システムがバラバラでした。

「お店」を探すときは、A さんの司書が担当。
「料理」を探すときは、B さんの司書が担当。
「スーパーの食材」を探すときは、C さんの司書が担当。

これでは、司書たちがそれぞれ別のルールで働いていて、管理が大変だし、ユーザーが「ピザ」と検索したときに、ピザ屋さんの「ピザ」と、スーパーの「冷凍ピザ」をうまく区別したり、関連付けたりするのが難しかったです。

2. 新しいシステム：一人の「超・万能司書」

今回 Uber Eats が導入したのは、**たった一人の「超・万能司書（AI モデル）」**です。
この司書は、世界中のあらゆる言語（英語、日本語、スペイン語など）を話し、お店・料理・食材のすべてを理解できます。

どんな入力でも理解する： ユーザーが「ピザ」と入力すると、司書は「あ、これは料理のピザか、それともピザ屋さんのことか？」と、文脈（国や言語）を考慮して瞬時に判断します。
同じ「言葉のイメージ」で整理： 司書は、すべてのアイテムを「意味の地図（ベクトル空間）」という巨大な倉庫に整理します。意味が近いもの（例：「スパゲッティ」と「パスタ」）は、倉庫の中で隣同士に置かれます。

3. 司書を鍛える方法：2 段階のトレーニング

この司書をただの新人から、ベテランに育てるために、2 段階の厳しいトレーニングを行いました。

第 1 段階：膨大な履歴の学習（InfoNCE）
- 何億もの「ユーザーが検索して、実際にクリックした履歴」を学習させます。「『寿司』と検索して『寿司屋』をクリックした」という事実を、ひたすら反復して覚えさせます。これで、基本的な検索の感覚が身につきます。
第 2 段階：難しい問題の克服（Triplet NCE）
- ここがポイントです。AI にとって「迷うような難しい問題」を特別に作りました。
- 例：「『パン』と検索したとき、フランスパン屋さんと、スーパーの食パン、どっちがユーザーの意図に近いのか？」
- 高度な AI（LLM）に「これは正解、これは不正解」と厳しくチェックさせたデータを元に、「迷いやすいケース」を徹底的に練習させました。これにより、微妙なニュアンスの違いも理解できるようになりました。

4. 便利な機能：「ロシア人形（マトリョーシカ）」のような検索

このシステムには、**「マトリョーシカ（ロシア人形）」**のようなすごい仕組みがあります。

大きさを選べる： 通常、検索結果を返すには「大きな人形（高品質なデータ）」を使いますが、スマホの通信が混雑しているときや、すぐに結果を出したいときは、「小さな人形（データを切り詰めたもの）」を使えます。
1 つのモデルで全て： 昔は「小さい人形用」「大きい人形用」と別々のモデルを用意していましたが、今は1 つのモデルで、状況に合わせて「128 次元」「256 次元」「1536 次元」と、必要な大きさだけを取り出して使えます。
- メリット： 倉庫のスペース（ストレージコスト）が激減し、検索も爆速になります。

5. 結果：どれくらい良くなった？

この新しいシステムを導入した結果、以下のような劇的な変化がありました。

見つけやすさの向上： 昔のシステムに比べ、「お店」の検索で見つかる確率が最大で 88% 向上しました。「探しているものが、検索結果のトップにちゃんと並ぶ」ようになりました。
言語の壁の突破： 日本や台湾など、以前は検索精度が低かった国でも、大幅に改善されました。
コストと速度の両立： 検索の精度を落とさずに、データ保存コストを96% 削減（100 分の 4 まで）することに成功しました。まるで、同じ量の荷物を、もっと小さいトラックで運べるようになったようなものです。

まとめ

この論文は、Uber Eats が**「バラバラだった検索システムを、一人の天才的な万能司書に統一し、何億ものデータで鍛え上げ、さらに状況に合わせてサイズを変えられるようにした」**という、画期的な技術の成功物語です。

おかげで、ユーザーは「何か食べたい」と検索したとき、より早く、より正確に、自分の好みの料理やお店を見つけられるようになったのです。

Scaling Multilingual Semantic Search in Uber Eats Delivery

1. 昔のシステム：バラバラの司書たち

2. 新しいシステム：一人の「超・万能司書」

3. 司書を鍛える方法：2 段階のトレーニング

4. 便利な機能：「ロシア人形（マトリョーシカ）」のような検索

5. 結果：どれくらい良くなった？

まとめ

Uber Eats における多言語セマンティック検索のスケールアップ：技術概要

1. 問題定義 (Problem)

2. 手法 (Methodology)

2.1 モデルアーキテクチャ：Two-Tower 構造

2.2 学習戦略：2 段階のトレーニング

2.3 柔軟な埋め込み：Matryoshka Representation Learning (MRL)

2.4 スコアリング手法

3. 主要な貢献 (Key Contributions)

4. 結果 (Results)

4.1 オフライン評価 (Recall 向上)

4.2 効率性とコスト削減 (MRL & Quantization)

4.3 オンライン A/B テスト結果

5. 意義と結論 (Significance)

Scaling Multilingual Semantic Search in Uber Eats Delivery

1. 昔のシステム：バラバラの司書たち

2. 新しいシステム：一人の「超・万能司書」

3. 司書を鍛える方法：2 段階のトレーニング

4. 便利な機能：「ロシア人形（マトリョーシカ）」のような検索

5. 結果：どれくらい良くなった？

まとめ

Uber Eats における多言語セマンティック検索のスケールアップ：技術概要

1. 問題定義 (Problem)

2. 手法 (Methodology)

2.1 モデルアーキテクチャ：Two-Tower 構造

2.2 学習戦略：2 段階のトレーニング

2.3 柔軟な埋め込み：Matryoshka Representation Learning (MRL)

2.4 スコアリング手法

3. 主要な貢献 (Key Contributions)

4. 結果 (Results)

4.1 オフライン評価 (Recall 向上)

4.2 効率性とコスト削減 (MRL & Quantization)

4.3 オンライン A/B テスト結果

5. 意義と結論 (Significance)

関連論文

Network Slicing in 5G Mobile Communication Architecture, Profit Modeling, and Challenges

Pwned: How Often Are Americans' Online Accounts Breached?

Excess demand in public transportation systems: The case of Pittsburgh's Port Authority

Implicit Biases in Refereeing: Lessons from NBA Referees

BOPIM: Bayesian Optimization for influence maximization on temporal networks