Discovering New Theorems via LLMs with In-Context Proof Learning in Lean

本論文は、形式検証済みの定理と証明を反復的に LLM 自身にフィードバックすることで文脈内学習を活用し、新規かつ証明が困難な数学的予想の発見率と成功を大幅に向上させるパイプラインである「仮説・証明ループ(CPL)」を導入する。

原著者: Kazumi Kasaura, Naoto Onda, Yuta Oriike, Masaya Taniguchi, Akiyoshi Sannai, Sho Sonoda

公開日 2026-05-07
📖 1 分で読めます☕ さくっと読める

原著者: Kazumi Kasaura, Naoto Onda, Yuta Oriike, Masaya Taniguchi, Akiyoshi Sannai, Sho Sonoda

原論文は CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/) でライセンスされています。 これは以下の論文のAI生成解説です。著者が執筆または承認したものではありません。技術的な正確性については原論文を参照してください。 免責事項の全文を読む

Each language version is independently generated for its own context, not a direct translation.

非常に賢いものの、少し忘れっぽいロボットに、複雑な数学パズルを解く方法を教えることを想像してみてください。そのロボットは大規模言語モデル(LLM)であり、パズルはLeanと呼ばれる厳密なコンピュータ言語で書かれた形式的な数学的証明です。

この論文は、このロボットを教える新しい方法として、**「仮説・証明ループ(CPL)」**を導入しています。その仕組みを、簡単なアナロジーを用いて説明します。

問題:「推測と検証」の罠

通常、AI に数学をさせようとする際、人々は**「パズルを推測し、それを一度に解く」**よう求めています。

  • アナロジー: 学生に「数学の問題を作成し、即座にそれを解け」と頼むことを想像してください。
  • 問題点: 学生は怠惰になります。解きやすい「2 + 2 = 4」のような簡単な問題を書くのです。なぜなら、それらは解きやすいからです。彼らは失敗するかもしれないと知っているため、難しい問題を避けようとします。その結果、AI は数千もの簡単で退屈な証明を生成し、難しく面白いものを見逃してしまいます。

解決策:「二段階のダンス」(CPL)

著者たちは、このプロセスを**「仮説立案者(Conjecturer)」(アイデア生成者)と「証明者(Prover)」**(解き手)という 2 つの明確な役割に分割しました。

  1. 仮説立案者(建築家): AI のこの部分は、既存の数学規則のライブラリを参照し、新しいアイデア(仮説)を考え出します。まだそれを解こうとはせず、ただ書き留めるだけです。
  2. 証明者(建設者): この部分はアイデアを受け取り、それらの証明を構築しようとします。失敗すれば、再び試みます。成功するか、試行回数が尽きるまで、試行を繰り返します。
  3. ライブラリ(記憶): 証明者が証明を成功させるたびに、その証明はライブラリに追加されます。

魔法の材料:コンテキスト内学習
ここが巧妙な点です。証明者は、元の数学規則だけを見るのではありません。現在のセッション中にすでに成功して構築した証明のライブラリも参照します。

  • アナロジー: 学生がテストを受ける場面を想像してください。従来の方法では、テスト開始前に暗記した内容だけを頼りにしていました。しかし、この新しい方法では、学生が問題を正しく解くたびに、次の問題に取り掛かる前に、自分自身の解答を読むことが許可されます。彼らは、自分自身の最近の成功から「コツ」や「戦略」を学びます。

発見されたこと

研究者たちは、AI がまだ十分に熟知していないトポロジー(形状や空間を扱う数学の一分野)のいくつかの難しい概念で、この方法をテストしました。

  • 量対質: 従来の方法(一度に推測して解く)は、より多くの定理を生成しましたが、それらはほとんどが短く簡単でした。新しい方法(CPL)は、生成される定理の総数は少なくなりましたが、それらははるかに難しく、長くなりました。
  • 大きな勝利: 新しい方法は、「アルファ・オープン集合」に関する特定の難しい定理を、従来の方法が 20 回試行しても決して発見できなかったものを、見事に発見しました。
  • 成功からの学習: AI に、自分自身の過去の証明のライブラリを「カンニングペーパー(コンテキスト)」として与えたとき、そのコンテキストなしでは解けなかった難しい定理を証明することができました。AI が平易な英語で定理を証明できなかった場合でも、類似した成功した証明を見た後は、Lean コードで証明することができました。

結論

この論文は、「アイデア生成」と「証明解決」を分離し、AI がリアルタイムで自らの検証済みの成功から学習させることで、そうでなければ見逃してしまうより困難で複雑な数学的真理を発見させることができると主張しています。これは、最終試験を受ける前に自らの宿題を勉強させることで、AI に助走をつけさせるようなものです。

注記: この論文は、数学的定理の生成と検証に関するこの方法に厳密に焦点を当てています。医療診断、金融予測、または形式的数学以外の他の実世界への応用において、この方法が機能すると主張しているわけではありません。

自分の分野の論文に埋もれていませんか?

研究キーワードに一致する最新の論文のダイジェストを毎日受け取りましょう——技術要約付き、あなたの言語で。

Digest を試す →