LeanTutor: Towards a Verified AI Mathematical Proof Tutor

Der Artikel stellt LeanTutor vor, ein Proof-of-Concept-System, das die Stärken von Large Language Models und dem Theorembeweiser Lean kombiniert, um einen verifizierten KI-Mathematik-Tutor zu entwickeln, und führt zur Evaluierung den PeanoBench-Datensatz ein.

Manooshree Patel, Rayna Bhattacharyya, Thomas Lu, Arnav Mehta, Niels Voss, Narges Norouzi, Gireeja Ranade

Veröffentlicht 2026-03-05
📖 3 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Stellen Sie sich vor, Sie lernen Mathe, aber Ihr Lehrer ist ein bisschen verrückt.

Auf der einen Seite haben Sie den KI-Chatter (wie einen sehr gesprächigen, aber manchmal etwas verwirrten Freund). Er kann in fließendem Deutsch mit Ihnen reden, Erklärungen geben und motivieren. Aber wenn es um die harte, logische Mathematik geht, macht er gerne kleine Fehler – er halluziniert manchmal Beweise, die gar nicht stimmen.

Auf der anderen Seite haben Sie den strengen Mathe-Roboter (einen Theorembeweiser wie „Lean"). Dieser ist absolut perfekt. Wenn er sagt, ein Beweis ist richtig, dann ist er zu 100 % richtig. Aber er redet wie ein Computer: trocken, ohne Gefühle und für normale Menschen oft völlig unverständlich. Wenn Sie einen Fehler machen, sagt er nur: „Fehler. Versuchen Sie es nochmal", ohne zu erklären, warum.

LeanTutor ist nun wie ein genialer Dolmetscher und Coach, der diese beiden Welten zusammenbringt.

Wie funktioniert dieser Coach?

Stellen Sie sich LeanTutor als ein Team aus drei Spezialisten vor, die an einem Tisch sitzen, um Ihnen beim Lösen einer mathematischen Aufgabe zu helfen:

  1. Der Übersetzer (Autoformalizer):
    Wenn Sie auf Deutsch sagen: „Ich ziehe jetzt 5 von 10 ab", übersetzt dieser Spezialist Ihre Worte sofort in die exakte, strenge Sprache des Mathe-Roboters. Er sorgt dafür, dass der Roboter genau versteht, was Sie meinen.

  2. Der nächste Schritt (Next-Step Generator):
    Dieser Teil schaut auf die Aufgabe und sagt Ihnen: „Okay, der nächste logische Schritt wäre, diese Zahl hier zu addieren." Er nutzt die Stärke des KI-Chatters, um Ihnen Ideen zu geben, aber er hält sich strikt an die Regeln, die der Roboter vorgibt.

  3. Der Erklärer (Feedback Generator):
    Wenn Sie einen Fehler machen, schaut der Roboter nicht nur auf das Ergebnis. Der Erklärer nimmt den Fehler des Roboters und wandelt ihn in eine freundliche, verständliche Erklärung um: „Achtung, hier haben Sie die Regel für negative Zahlen übersehen. Hier ist der Grund..."

Der Testlauf: Das „Peano-Bench"

Um zu prüfen, ob dieses Team wirklich funktioniert, haben die Forscher eine Art Trainingslager namens „PeanoBench" gebaut.
Stellen Sie sich das wie ein riesiges Übungsheft vor, das 371 verschiedene mathematische Aufgaben enthält. Jede Aufgabe ist zweimal vorhanden: einmal in normaler Sprache (wie in einem Schulbuch) und einmal in der strengen Computersprache. Das System muss nun lernen, zwischen diesen beiden Welten zu navigieren und Beweise zu führen, die sowohl logisch korrekt als auch für Menschen verständlich sind.

Das Fazit

Kurz gesagt: LeanTutor ist wie ein smarter Tutor, der die Kommunikationsfähigkeit eines Menschen mit der unfehlbaren Logik eines Computers verbindet. Er versucht, das Lernen von komplexer Mathematik so zu gestalten, dass es nicht nur korrekt ist, sondern auch Spaß macht und wirklich verstanden wird – ohne dass man sich wie ein Programmierer fühlen muss.

Erhalten Sie solche Paper in Ihrem Posteingang

Personalisierte tägliche oder wöchentliche Digests passend zu Ihren Interessen. Gists oder technische Zusammenfassungen, in Ihrer Sprache.

Digest testen →