OSCAR: Online Soft Compression And Reranking

OSCAR は、推論時に検索された情報を動的に圧縮して計算コストを削減し、同時に再ランク付けを行うことで、精度を維持したまま RAG パイプラインの推論速度を 2〜5 倍に向上させる新しいオンラインソフト圧縮手法を提案するものです。

Maxime Louis, Thibault Formal, Hervé Dejean, Stéphane Clinchant

公開日 2026-03-05
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

OSCAR: 検索した情報を「賢く要約」して、AI を爆速にする新技術

2026 年 3 月、NAVER ラボス・ヨーロッパの研究チームが発表した**「OSCAR」**という新しい技術について、難しい専門用語を使わずに、日常の例え話を使って解説します。

🎒 問題:AI が「重すぎる」理由

まず、現代の AI(大規模言語モデル)が質問に答える仕組み「RAG(検索拡張生成)」について考えてみましょう。

  • 従来の仕組み:
    AI に質問すると、まずインターネットやデータベースから**「関連する文章(ドキュメント)」を 10 個も 20 個も引っ張ってきます**。
    しかし、これらの文章はすべて**「生のテキスト(文字の羅列)」**のまま AI に渡されます。

    例え話:
    料理をするシェフ(AI)に、10 冊もの分厚い料理本(検索結果)を丸ごと渡して、「この中からレシピを探して作って」と頼むようなものです。シェフは本を全部読み飛ばさなければならず、時間がかかりすぎます。また、本が重すぎて棚が崩れる(計算コストが爆発する)こともあります。

この「本を全部読む」作業が、AI の処理を遅くし、お金(計算資源)を無駄にしています。


✨ 解決策:OSCAR の登場

そこで登場するのがOSCARです。OSCAR は**「検索した情報を、AI が読みやすい形に『その場ですぐに』変換する」**という魔法のような技術です。

1. 「ハード圧縮」ではなく「ソフト圧縮」

これまでの技術には 2 つのタイプがありました。

  • ハード圧縮(従来の要約): 文章を切り捨てて短くする。「要約文」を作る方法。
    • 欠点: 重要な情報が消えてしまうことがあり、圧縮率も低いです。
  • ソフト圧縮(オフライン変換): 文章を「数値のベクトル(暗号のようなもの)」に変えて、事前に準備しておく方法。
    • 欠点: 事前に準備が必要で、リアルタイム(オンライン)には使えません。

OSCAR のすごいところ:
OSCAR は**「質問(クエリ)を見てから、その瞬間に文章を圧縮する」という、これまでになかった「オンライン・ソフト圧縮」**を実現しました。

例え話:
シェフ(AI)が「今日の献立は?」と聞かれた瞬間、助手(OSCAR)が 10 冊の料理本を**「その質問にだけ必要な部分だけ抽出した、超コンパクトなメモ帳」に書き換えて渡します。
しかも、このメモ帳は
「質問の内容に合わせて中身が変わる」**ので、無駄な情報が一切入っていません。

2. 「圧縮」と「順位付け」を同時にやる

OSCAR はもう一つ、賢いことをやります。
検索結果の 10 個の文章を圧縮する際、「どれが最も重要か」も同時に判断します。

例え話:
助手がメモ帳を作る際、「この 3 冊は重要だから太字で、この 7 冊は関係ないから薄く」と優先順位もつけて渡してくれます。
これにより、AI は「どの本を先に読むか」を考える必要がなくなり、さらに効率が上がります。


🚀 OSCAR がもたらすメリット

この技術を使うと、どんな変化が起きるのでしょうか?

  1. 爆速になる(2〜5 倍速く):
    AI が読み込む情報量が劇的に減るため、回答までの時間が大幅に短縮されます。
  2. 精度は落ちない:
    情報を削ぎ落としたのに、答えの正確さは「生データを使う場合」とほぼ同じか、むしろ良くなることもあります。
  3. どんな AI でも使える:
    小さな AI(10 億パラメータ)から巨大な AI(240 億パラメータ)まで、あらゆるサイズに対応しています。

🧠 まとめ:OSCAR とは何か?

OSCAR は、**「AI にとっての『賢い通訳』」**のような存在です。

  • 以前: 膨大な資料をそのまま AI に渡す → AI が疲れて遅くなる。
  • OSCAR 以降: 資料を AI の「質問」に合わせて、**必要な情報だけを抽出・圧縮した「超コンパクトなメモ」**に変えてから渡す → AI はすらすらと答えられる。

これにより、私たちは**「より安く、より速く、より正確に」**AI の力を借りられるようになります。まるで、重たい荷物を運ぶトラックが、軽量化されたスポーツカーに生まれ変わったようなものです。

この技術はすでに公開されており、今後の AI アプリケーションをより身近で使いやすいものにする大きな一歩となるでしょう。