LeanTutor: Towards a Verified AI Mathematical Proof Tutor

Dit paper introduceert LeanTutor, een proof-of-concept systeem dat de kracht van Large Language Models en theorem provers combineert om een AI-gedreven wiskundige bewijstutor te creëren die zowel natuurlijk taalverkeer als wiskundige correctheid garandeert, geëvalueerd met de nieuwe PeanoBench-dataset.

Manooshree Patel, Rayna Bhattacharyya, Thomas Lu, Arnav Mehta, Niels Voss, Narges Norouzi, Gireeja Ranade

Gepubliceerd 2026-03-05
📖 2 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat wiskunde bewijzen schrijven een beetje is als het bouwen van een heel complexe, perfecte toren van Legoblokken.

In de wereld van vandaag hebben we twee soorten "bouwers":

  1. De Talige Verteller (LLM's): Dit zijn slimme robots die heel goed kunnen praten en uitleggen hoe je de toren moet bouwen. Ze gebruiken mooie zinnen en klinken heel overtuigend. Maar ze maken vaak fouten. Ze kunnen zeggen: "Zet hier een rood blokje," terwijl dat blokje eigenlijk niet past en de hele toren laat instorten. Ze zijn goed in praten, maar slecht in controleren of het echt klopt.
  2. De Strikte Bouwmeester (Lean): Dit is een computerprogramma dat onfeilbaar is. Als het zegt dat de toren staat, dan staat hij perfect. Maar deze bouwmeester spreekt een heel moeilijke, cryptische taal. Voor een student is het net als proberen een boek te lezen in een taal die je nooit hebt geleerd. Het is te moeilijk om zelf te leren.

LeanTutor is de oplossing die deze twee wereldjes samenbrengt. Het is als een slimme leerkracht die twee superkrachten heeft:

  • De Vertaler: Deze vertaalt wat de student in gewone taal zegt (bijvoorbeeld: "Ik doe dit blokje hier") naar de strenge taal van de Bouwmeester, zodat die het kan controleren.
  • De Hulp bij de Volgende Stap: Als de student vastloopt, denkt de leerkracht mee en zegt: "Probeer eens dit blokje hier," maar dan in de taal die de Bouwmeester begrijpt.
  • De Vriendelijke Uitlegger: Als er een fout is, vertaalt de leerkracht de strenge waarschuwing van de Bouwmeester ("Fout: blokje 4 past niet op blokje 3") terug naar een vriendelijke zin in gewone taal die de student echt begrijpt.

Om te testen of dit werkt, hebben de makers van LeanTutor een speciale speelset gemaakt genaamd PeanoBench. Dit is een verzameling van 371 wiskundige puzzels (over getallen) die zowel in gewone taal als in de strenge taal zijn opgeschreven. Het is alsof ze een testexamen hebben gemaakt om te zien of hun nieuwe leerkracht echt kan helpen zonder de toren te laten instorten.

Kortom: LeanTutor is de perfecte assistent die de vriendelijkheid en begrijpelijkheid van een menselijke leraar combineert met de onfeilbare nauwkeurigheid van een computer, zodat iedereen wiskunde kan leren zonder bang te zijn voor fouten.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →