SOLARIS: Speculative Offloading of Latent-bAsed Representation for Inference Scaling

Meta が広告システムに導入した SOLARIS は、将来のリクエストを予測して非同期に基盤モデルの表現を事前生成する「Speculative Offloading」手法により、計算コストを削減しつつリアルタイム推論を可能にし、収益向上を実現しました。

Zikun Liu, Liang Luo, Qianru Li, Zhengyu Zhang, Wei Ling, Jingyi Shen, Zeliang Chen, Yaning Huang, Jingxian Huang, Abdallah Aboelela, Chonglin Sun, Feifan Gu, Fenggang Wu, Hang Qu, Huayu Li, Jill Pan, Kaidi Pei, Laming Chen, Longhao Jin, Qin Huang, Tongyi Tang, Varna Puvvada, Wenlin Chen, Xiaohan Wei, Xu Cao, Yantao Yao, Yuan Jin, Yunchen Pu, Yuxin Chen, Zijian Shen, Zhengkai Zhang, Dong Liang, Ellie Wen

公開日 2026-04-15
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

ソーラーリス(SOLARIS):超巨大な AI を「予習」させて、リアルタイムで賢くする仕組み

この論文は、メタ(Meta)社が広告システムで実用化した、「超巨大で賢い AI(基礎モデル)」を、遅延なく、しかも高品質に使えるようにした画期的な技術について書かれています。

専門用語を抜きにして、日常の例えを使ってわかりやすく解説します。


1. 問題:「天才」は遅すぎる

現代の推薦システム(あなたが「これを見てね」と広告を出す仕組み)には、**「基礎モデル(Foundation Model)」**という超巨大で天才的な AI がいます。

  • 得意なこと: 膨大なデータから、ユーザーの好みを完璧に理解し、どんな広告がヒットするかを予測する。
  • 弱点: 頭が良すぎるがゆえに、計算が重すぎて**「リアルタイム(一瞬で)」**に答えを出すのが不可能。

そこで、これまで業界では**「知識の蒸留(Distillation)」**という方法がとられていました。

  • 例え: 「天才 AI(先生)」が教えた答えを、**「小さな AI(生徒)」**がノートに写し取る。
  • 問題点:
    1. 先生が教えた「深い理解」の 20〜25% しか生徒に伝わらない(情報のロス)。
    2. 生徒が勉強できるのは「授業中(モデル作成時)」だけ。実際の授業(広告表示の瞬間)には、先生は呼べない。

2. ソーラーリス(SOLARIS)の解決策:「予習」で天才を呼び出す

SOLARIS は、この問題を**「推論時の知識蒸留(Inference-time Knowledge Distillation)」という新しい方法で解決しました。核心は「予習(Speculative Offloading)」**です。

① 天才の「予習」を裏側で行う

SOLARIS は、「今、誰が何を見る可能性が高いか」を予測し、その答えを事前に計算しておくという仕組みです。

  • 例え: 人気レストラン(基礎モデル)が、**「明日の予約が来そうな客(ユーザー)」を予測し、彼らが注文しそうな料理のレシピ(AI の答え)を「朝のうちに」**作り置きしておく。
  • 仕組み:
    • 裏側で「天才 AI」が、将来必要になりそうな「ユーザー×広告」の組み合わせを計算し、その「答え(埋め込み表現)」をメモ帳(キャッシュ)に保存します。
    • ユーザーが実際に広告を見た瞬間、そのメモ帳から答えを即座に引き出します。
    • これにより、重い計算をリアルタイムで行わずとも、「天才 AI の知恵」を瞬時に使えるようになります。

② 予習が外れた場合の「代わりの知恵」

もちろん、100% 予習通りにはいきません(新しいユーザーや、予想外の広告など)。そこで、SOLARIS は 2 つの工夫でカバーします。

  • A. 「その人の過去の行動」をまとめる(集約)
    • 特定の広告の答えがなくても、「その人が過去 24 時間に見た広告の傾向」をまとめて、その人の「好みのプロフィール」を作ります。
    • 例え: 特定の料理の注文がなくても、「この人は和食が好きだ」という過去の注文履歴から、和食系の提案をする。
  • B. 「似た人」の知恵を借りる(類似性)
    • 自分自身の答えがなくても、「自分と趣味が似ている人」が選んだ答えを参考にします。
    • 例え: 「あなたと趣味が似ている A さんが、この広告を気に入ったなら、あなたも気に入るはず」という推測。

3. 結果:どれくらいすごいのか?

この仕組みをメタの広告システム(1 日数十億回のリクエスト)に導入した結果は驚異的です。

  • 精度向上: 広告がクリックされる確率(CTR)や、購入される確率(CVR)の予測精度が大幅に向上しました。
  • 知識の伝達率: 従来の方法(20〜25%)から、40% 以上に跳ね上がりました(2 倍近く!)。
  • 収益: 広告収益が0.67% 増加しました。これは、メタの規模で見ると年間 1 億ドル(約 150 億円)規模の利益に相当します。
  • 遅延なし: ユーザーに広告を表示する瞬間の速度は遅くなりませんでした。

まとめ:どんなイメージ?

SOLARIS は、**「天才的なコンサルタント(基礎モデル)を、常にそばに置かずに、彼が『予習』したメモ帳を、現場の担当者(小さな AI)が即座に使えるようにしたシステム」**です。

  • 以前: 現場で天才に相談すると、答えが出るまで待たされる(遅い)。
  • SOLARIS: 天才が「明日はこんな人が来るはず」と予測してメモ帳を作っておく。現場の担当者は、そのメモ帳を見て即座に最高の提案ができる。

これにより、**「遅いけど超賢い AI」「速いけど少ししか知らない AI」**のいいとこ取りを実現し、ユーザーにはより適切な広告を、企業にはより多くの収益をもたらす仕組みが完成しました。

このような論文をメールで受け取る

あなたの興味に合わせた毎日または毎週のダイジェスト。Gistまたは技術要約を、あなたの言語で。

Digest を試す →