Agnostics: Learning to Code in Any Programming Language via Reinforcement with a Universal Learning Environment

本論文は、コードの外部観測可能な振る舞いのみを評価する言語非依存の検証環境と強化学習パイプライン「Agnostics」を提案し、追加の言語固有エンジニアリングなしに低リソース言語における LLM のコーディング能力を大幅に向上させ、既存の大型モデルに匹敵する性能を達成したことを報告しています。

Aleksander Boruch-Gruszecki, Yangtian Zi, Zixuan Wu, Tejas Oberoi, Carolyn Jane Anderson, Joydeep Biswas, Arjun Guha

公開日 2026-03-03
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

この論文「AGNOSTICS」は、**「AI がプログラミング言語の『方言』をマスターするための、画期的な新しい勉強法」**を提案するものです。

以下に、専門用語を排し、身近な例え話を使って解説します。

1. 問題:AI は「英語」は得意だが、「方言」は苦手

現在の AI(大規模言語モデル)は、Python や JavaScript といった**「主流のプログラミング言語(英語のようなもの)」を書くのが非常に上手です。
しかし、科学計算やデータ分析で使われる
「マイナーな言語(Fortran, Julia, R など)」**になると、AI の性能はガクッと落ちます。

なぜか?

  • 教材が少ない: 主流言語の学習データは山ほどありますが、マイナー言語のデータは極端に不足しています。
  • 先生(テスト)がいない: AI を鍛えるには「正解かどうかを判定する先生」が必要です。しかし、言語ごとに専用のテスト環境を作るのは、まるで「言語ごとに新しい学校を建てて、新しい先生を雇う」ような大変な作業でした。

2. 解決策:「Agnostics(アグノスティクス)」という新しい勉強法

この論文のチームは、**「言語ごとの先生を雇う必要はない!『結果』さえ見れば、どの言語でも判定できる万能な判定員がいる」**というアイデアを思いつきました。

彼らが開発した「Agnostics」は、以下のような仕組みです。

① 言語を「翻訳」するのではなく「行動」で見る

従来の方法だと、「Python のコード」と「Fortran のコード」を別々にテストしていました。
でも、Agnostics は**「コードがどう書かれているか」ではなく、「入力に対してどう出力するか(行動)」**だけを見ます。

  • 例え話:
    • 従来の方法: 「フランス語の料理」と「イタリア語の料理」を別々のシェフに作らせ、それぞれの言語の専門家に見せて味見させる。
    • Agnostics の方法: 「シェフが何語で話そうと、注文した『ハンバーガー』が完成すれば OK」とする。言語(レシピ)は関係なく、「出来上がった料理(結果)」だけが重要なのです。

② 超簡単な設定ファイルで対応

新しい言語を学ぶには、たった数行の設定ファイル(YAML)を書くだけで OK です。

  • 「この言語のコンパイラはこれを使ってね」
  • 「入力はここから読んで、出力はここに出してね」
    これだけで、AI はその言語の「練習問題」を解き始めます。

③ 試行錯誤を繰り返して上達(強化学習)

AI は最初は失敗します。でも、Agnostics は**「正解の出力と一致すればご褒美(報酬)、違えばゼロ」**というルールで、AI に何度も試行錯誤させます。
これを「強化学習」と呼びますが、Agnostics はどの言語でもこのルールを適用できるため、マイナー言語でも AI が自ら学習して上達していくことができます。

3. 驚異的な成果

この方法を使って、小さな AI モデル(40 億パラメータなど)を、Lua, Julia, R, OCaml, Fortran という 5 つのマイナー言語で訓練しました。

  • 結果:
    • 小さな AI モデルが、160 億〜700 億パラメータもある巨大な AI モデルに匹敵する性能を発揮するようになりました。
    • 従来の方法では「0%」に近い正解率だった言語でも、15%〜20% まで劇的に向上しました。
    • 設定ファイルを作るのに要した時間は、言語あたりわずか 1 時間でした。

4. まとめ:なぜこれがすごいのか?

これまでの AI 開発は、「新しい言語を教えるたびに、莫大なコストと手間がかかる」のが常識でした。
しかし、Agnostics は**「言語の壁を取り払う」ことで、「たった数行の設定で、どんな言語でも AI を鍛えられる」**ようにしました。

イメージ:
これまでは「フランス語を教えるにはフランス人の先生が必要で、ドイツ語にはドイツ人の先生が必要」と言われていましたが、Agnostics は**「生徒が正解の『答え』を出せれば、先生は誰でもいい(あるいは AI 自身が先生になる)」**という、自由で効率的な学習システムを実現したのです。

これにより、科学者やエンジニアが使うマイナーな言語でも、AI が強力なパートナーとして活躍できるようになることが期待されています。

このような論文をメールで受け取る

あなたの興味に合わせた毎日または毎週のダイジェスト。Gistまたは技術要約を、あなたの言語で。

Digest を試す →