LeanTutor: Towards a Verified AI Mathematical Proof Tutor

Este artigo apresenta o LeanTutor, um tutor de provas matemáticas baseado em IA que combina as capacidades de comunicação natural de modelos de linguagem com a correção verificável de provadores de teoremas, e introduz o PeanoBench como um novo conjunto de dados para avaliação.

Manooshree Patel, Rayna Bhattacharyya, Thomas Lu, Arnav Mehta, Niels Voss, Narges Norouzi, Gireeja Ranade

Publicado 2026-03-05
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você está aprendendo a andar de bicicleta. Você tem dois tipos de "instrutores" disponíveis:

  1. O Amigo Conversador (LLM): É um amigo muito falante, inteligente e rápido. Ele pode explicar tudo em linguagem comum, mas às vezes ele inventa coisas, dá conselhos errados ou, pior, te diz exatamente como chegar ao topo da montanha sem deixar você pedalar.
  2. O Chefe de Engenharia (Provedor de Teoremas): É um robô extremamente rigoroso. Ele não erra. Se você fizer um movimento errado, ele grita "ERRO!" e não deixa você continuar. O problema é que ele só fala uma língua estranha e difícil (código), e se você não souber essa língua, ele não consegue te ajudar.

O LeanTutor é a criação de um novo tipo de professor que une o melhor dos dois mundos. É como ter um tradutor mágico que faz o "Amigo Conversador" e o "Chefe de Engenharia" trabalharem juntos.

Como funciona o LeanTutor?

O sistema é dividido em três "mágicos" que trabalham em equipe:

  1. O Tradutor (Autoformalizador):
    Imagine que você escreve sua prova matemática em português, como se estivesse conversando com um amigo. O "Tradutor" pega o que você escreveu e tenta transformá-lo instantaneamente na língua estranha do "Chefe de Engenharia" (código Lean).

    • O desafio: Se você pular um passo ou escrever algo confuso, o Tradutor precisa entender que você errou, em vez de inventar uma versão correta que não é a sua.
  2. O Detetive de Próximos Passos (Gerador de Próximo Passo):
    Se o "Chefe de Engenharia" diz que a prova está travada ou errada, o Detetive entra em ação. Ele olha para onde você está e, usando o código, tenta descobrir qual seria o próximo movimento lógico para continuar. Ele não te dá a resposta final, mas te diz: "Ei, tente usar esta ferramenta aqui".

  3. O Professor de Português (Gerador de Feedback):
    Este é o cara que fala com você. Ele pega o erro que o "Chefe" detectou e a sugestão do "Detetive" e transforma tudo em uma dica amigável. Em vez de dizer "Sintaxe inválida no comando X", ele diz: "Parece que você esqueceu de verificar o caso base. Tente simplificar essa parte primeiro".

O Grande Desafio: O "Jogo dos Números Naturais"

Para testar se essa ideia funcionava, os criadores do LeanTutor precisavam de um campo de treinamento. Eles usaram um dataset chamado PeanoBench.

Pense nisso como um livro de exercícios de matemática que contém 371 problemas. O que torna esse livro especial é que, para cada problema, eles têm duas versões:

  • A versão escrita por humanos (em português).
  • A versão escrita em código (em Lean).

Eles criaram até mesmo "versões erradas" dos exercícios, simulando erros comuns que alunos cometem (como pular um passo ou assumir algo sem provar), para ver se o sistema conseguia identificar e corrigir.

Por que isso é importante?

Hoje em dia, muitos alunos usam IAs (como o ChatGPT) para fazer lições de casa. O problema é que essas IAs muitas vezes:

  • Dão a resposta pronta (o aluno não aprende).
  • Inventam fatos (alucinações).
  • Não conseguem explicar por que algo está errado.

O LeanTutor tenta resolver isso. Ele permite que o aluno fale a língua dele (português), mas garante que a matemática por trás seja verificada com precisão absoluta pelo computador. É como ter um tutor que é paciente e conversador, mas que nunca deixa você passar de nível se não tiver realmente aprendido a lição.

O Resultado?

O sistema funcionou bem! Ele conseguiu:

  • Entender provas escritas de forma natural.
  • Identificar onde o aluno errou.
  • Dar dicas que ajudavam o aluno a pensar, em vez de apenas dar a resposta.

Em resumo: O LeanTutor é como um "ponte" segura entre a linguagem humana e a precisão matemática. Ele quer que a Inteligência Artificial ajude você a aprender a pensar, e não apenas a copiar respostas. É um passo gigante para tornar o ensino de matemática avançada mais acessível e confiável.