Discovering New Theorems via LLMs with In-Context Proof Learning in Lean

Cet article présente la boucle conjecture-preuve (CPL), un pipeline qui exploite l'apprentissage en contexte en alimentant itérativement un LLM avec ses propres théorèmes et preuves formellement vérifiés en Lean 4, afin d'améliorer considérablement le taux de découverte et le succès de conjectures mathématiques nouvelles et difficiles à démontrer.

Auteurs originaux : Kazumi Kasaura, Naoto Onda, Yuta Oriike, Masaya Taniguchi, Akiyoshi Sannai, Sho Sonoda

Publié 2026-05-07
📖 4 min de lecture☕ Lecture pause café

Auteurs originaux : Kazumi Kasaura, Naoto Onda, Yuta Oriike, Masaya Taniguchi, Akiyoshi Sannai, Sho Sonoda

Article original sous licence CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). Ceci est une explication générée par l'IA de l'article ci-dessous. Elle n'a pas été rédigée ni approuvée par les auteurs. Pour une précision technique, consultez l'article original. Lire la clause de non-responsabilité complète

Each language version is independently generated for its own context, not a direct translation.

Imaginez que vous essayez d'enseigner à un robot très intelligent, mais légèrement oublieux, comment résoudre des énigmes mathématiques complexes. Le robot est un Modèle de Langage à Grande Échelle (LLM), et les énigmes sont des preuves mathématiques formelles écrites dans un langage informatique strict appelé Lean.

L'article présente une nouvelle méthode pour enseigner à ce robot, appelée la Boucle de Conjecture-Preuve (CPL). Voici comment elle fonctionne, expliquée par le biais d'analogies simples :

Le Problème : Le Piège du « Deviner-et-Vérifier »

Habituellement, lorsque l'on tente de faire faire des mathématiques à une IA, on lui demande de deviner une énigme et de la résoudre en une seule fois.

  • L'Analogie : Imaginez demander à un élève de « Rédiger un problème de mathématiques et le résoudre immédiatement ».
  • Le Problème : L'élève devient paresseux. Il rédige des problèmes faciles (comme « 2 + 2 = 4 ») car ils sont simples à résoudre. Il évite les problèmes difficiles car il sait qu'il risque d'échouer. L'IA finit par générer des milliers de preuves faciles et ennuyeuses, manquant ainsi les problèmes difficiles et intéressants.

La Solution : La « Danse en Deux Temps » (CPL)

Les auteurs divisent le processus en deux rôles distincts : un Conjecteur (le Générateur d'Idées) et un Preuveur (le Résolveur).

  1. Le Conjecteur (L'Architecte) : Cette partie de l'IA examine une bibliothèque de règles mathématiques existantes et élabore de nouvelles idées (conjectures). Elle ne tente pas encore de les résoudre ; elle se contente de les écrire.
  2. Le Preuveur (Le Bâtisseur) : Cette partie prend les idées et tente de construire une preuve pour elles. Si elle échoue, elle réessaie. Elle continue d'essayer jusqu'à ce qu'elle réussisse ou qu'elle épuise ses tentatives.
  3. La Bibliothèque (La Mémoire) : Chaque fois que le Preuveur construit avec succès une preuve, cette preuve est ajoutée à la bibliothèque.

L'Ingrédient Magique : L'Apprentissage en Contexte
Voici la partie ingénieuse : le Preuveur ne se contente pas d'examiner les règles mathématiques originales. Il examine la bibliothèque de preuves qu'il a déjà construites avec succès au cours de la session en cours.

  • L'Analogie : Imaginez un élève passant un examen. À l'ancienne, il devait se fier uniquement à ce qu'il avait mémorisé avant le début de l'examen. Dans cette nouvelle méthode, chaque fois que l'élève résout correctement un problème, il a le droit de relire sa propre solution avant d'attaquer le problème suivant. Il apprend les « astuces » et les « stratégies » de ses propres succès récents.

Ce Qu'ils Ont Découvert

Les chercheurs ont testé cela sur des concepts topologiques délicats (une branche des mathématiques traitant des formes et des espaces) que l'IA ne maîtrisait pas encore bien.

  • Quantité vs Qualité : L'ancienne méthode (deviner et résoudre en une fois) a généré plus de théorèmes au total, mais ils étaient pour la plupart courts et faciles. La nouvelle méthode (CPL) a généré moins de théorèmes au total, mais ils étaient beaucoup plus difficiles et plus longs.
  • La Grande Victoire : La nouvelle méthode a découvert avec succès un théorème spécifique et difficile concernant les « ensembles alpha-ouverts » que l'ancienne méthode n'a jamais trouvé, même après 20 tentatives.
  • Apprendre du Succès : Lorsque l'IA a reçu la bibliothèque de ses propres preuves précédentes comme « aide-mémoire » (contexte), elle a pu prouver des théorèmes difficiles qu'elle n'aurait pas pu résoudre sans ce contexte. Même lorsque l'IA ne pouvait pas prouver le théorème en anglais courant, elle a pu le prouver en code Lean une fois qu'elle avait vu des preuves réussies similaires.

La Conclusion

L'article affirme qu'en séparant la « génération d'idées » de la « résolution de preuves » et en permettant à l'IA d'apprendre de ses propres succès vérifiés en temps réel, nous pouvons l'amener à découvrir des vérités mathématiques plus difficiles et plus complexes qu'elle manquerait autrement. C'est comme donner à l'IA un élan en lui permettant d'étudier ses propres devoirs avant de passer l'examen final.

Note : L'article se concentre strictement sur cette méthode pour générer et vérifier des théorèmes mathématiques. Il ne prétend pas que cette méthode fonctionne pour le diagnostic médical, les prévisions financières ou d'autres applications réelles en dehors des mathématiques formelles.

Noyé(e) sous les articles dans votre domaine ?

Recevez des digests quotidiens des articles les plus récents correspondant à vos mots-clés de recherche — avec des résumés techniques, dans votre langue.

Essayer Digest →