LeanTutor: Towards a Verified AI Mathematical Proof Tutor

Ce papier présente LeanTutor, un système de tutorat de preuves mathématiques combinant les forces des grands modèles de langage et des prouveurs de théorèmes pour offrir un feedback vérifié, évalué grâce à un nouveau jeu de données nommé PeanoBench.

Manooshree Patel, Rayna Bhattacharyya, Thomas Lu, Arnav Mehta, Niels Voss, Narges Norouzi, Gireeja Ranade

Publié 2026-03-05
📖 3 min de lecture☕ Lecture pause café

Each language version is independently generated for its own context, not a direct translation.

Imaginez que vous essayez d'apprendre à jouer aux échecs, mais avec un défi spécial : chaque coup que vous jouez doit être mathématiquement parfait, sans aucune erreur possible. C'est le monde des preuves mathématiques formelles.

Voici l'histoire de LeanTutor, un nouveau système intelligent conçu pour vous aider dans cette tâche, racontée simplement :

Le Problème : Deux mondes qui ne se parlent pas

Pour comprendre ce projet, il faut voir deux personnages qui ont du mal à s'entendre :

  1. Le Grand Orateur (les IA conversationnelles comme ChatGPT) : C'est un ami très bavard et sympathique qui parle un langage naturel fluide. Il peut vous expliquer les règles du jeu avec des mots doux. Mais attention, il a un défaut majeur : il se trompe souvent. Il peut inventer des règles ou faire des erreurs de logique en essayant de vous faire plaisir.
  2. Le Juge Rigide (les prouveurs de théorèmes comme Lean) : C'est un arbitre ultra-sérieux et intransigeant. Il ne tolère aucune erreur. Si vous faites un faux pas, il vous arrête net. C'est parfait pour garantir que la preuve est vraie, mais c'est très difficile à apprendre. C'est comme essayer d'apprendre à jouer aux échecs en lisant uniquement le code binaire de l'ordinateur : c'est précis, mais terriblement ennuyeux et incompréhensible pour un débutant.

La Solution : LeanTutor, le Traducteur Génial

L'équipe derrière LeanTutor a eu une idée brillante : pourquoi ne pas faire travailler ces deux personnages ensemble ? Ils ont créé un "tuteur" qui agit comme un chef d'orchestre ou un traducteur magique entre le langage humain et la rigueur mathématique.

Le système fonctionne comme une équipe de trois experts qui se passent le relais :

  1. Le Traducteur (L'autoformalisateur) : Quand vous écrivez une idée en français (ou dans votre langue), ce module la traduit instantanément dans le langage strict du "Juge Rigide". Il transforme vos mots en code que l'ordinateur peut vérifier.
  2. Le Coach de Stratégie (Le générateur de prochaine étape) : Si vous êtes bloqué, ce module regarde la situation et vous suggère le prochain coup logique à jouer. Il ne devine pas au hasard ; il utilise la puissance de l'IA pour trouver la meilleure suite, tout en restant dans les règles.
  3. Le Professeur Bienveillant (Le générateur de feedback) : C'est la partie la plus importante pour l'apprenant. Au lieu de vous dire froidement "Erreur de syntaxe", ce module vous explique pourquoi c'est faux, avec des mots simples et des encouragements, comme un vrai professeur qui vous guide.

Le Terrain d'Essai : PeanoBench

Pour voir si leur invention fonctionne vraiment, les chercheurs ont créé un terrain de jeu spécial appelé PeanoBench. Imaginez une salle d'entraînement avec 371 exercices différents. Chaque exercice existe en deux versions :

  • Une version écrite comme une histoire (en langage naturel).
  • Une version écrite comme un code informatique strict.

C'est comme un manuel d'entraînement où l'on compare la façon dont un humain explique un problème et la façon dont un ordinateur le résout. Cela permet de tester si LeanTutor arrive vraiment à faire le pont entre les deux.

En résumé

LeanTutor, c'est comme avoir un tuteur privé qui parle votre langue, mais qui est aussi capable de vérifier chaque mot avec la précision d'un laser. Il utilise la créativité des IA modernes pour vous expliquer les choses, tout en s'appuyant sur la rigueur des mathématiques pures pour s'assurer que vous n'apprenez jamais rien de faux. C'est un pas de géant pour rendre les mathématiques avancées accessibles à tous, sans sacrifier la vérité.