Human-in-the-Loop LLM Grading for Handwritten Mathematics Assessments

O artigo apresenta um fluxo de trabalho escalável de avaliação de provas manuscritas de matemática com assistência de LLM e verificação humana, que reduz o tempo de correção em cerca de 23% mantendo a precisão e a justiça.

Arne Vanhoyweghen, Vincent Holst, Melika Mobini, Lukas Van de Voorde, Tibo Vanleke, Bert Verbruggen, Brecht Verbeken, Andres Algaba, Sam Verboven, Marie-Anne Guerry, Filip Van Droogenbroeck, Vincent Ginis

Publicado 2026-03-16
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você é um professor de matemática com uma turma gigante. No final de cada semana, você precisa corrigir dezenas de cadernos cheios de cálculos feitos à mão. É cansativo, demorado e, se você tentar fazer tudo sozinho, os alunos recebem o feedback muito tarde, perdendo a chance de aprender com os erros.

Por outro lado, a Inteligência Artificial (IA) chegou com uma faca de dois gumes: ela pode fazer os trabalhos de casa dos alunos (o que é ruim para a avaliação), mas também pode ajudar a corrigi-los (o que é ótimo para o professor).

Este artigo conta a história de como um grupo de pesquisadores na Bélgica criou uma "equipe híbrida" para resolver esse problema. Eles não deixaram a IA fazer tudo sozinha, nem deixaram o professor fazer tudo sozinho. Eles criaram um sistema de "Humano no Comando com IA como Assistente".

Aqui está como funciona, explicado de forma simples:

1. O Problema: A Montanha de Papel

Antes, os alunos faziam testes em casa, mas com a IA avançando, ninguém sabia se o trabalho era deles. Então, voltaram a fazer testes rápidos em sala de aula, no papel. O problema? Corrigir papel à mão é lento. Digitalizar, ler a letra feia e dar nota consome horas preciosas.

2. A Solução: O Sistema de "Cozinheiro e Chefe"

Os pesquisadores criaram um fluxo de trabalho onde a IA é o cozinheiro e o professor é o chefe.

  • O Passo 1: O Menu (A Chave de Correção)
    Antes de começar, os professores criam um "menu" super detalhado. Não é apenas "está certo ou errado". É como uma receita: "Se o aluno fez X, ganha 2 pontos. Se fez Y, ganha 3 pontos". A IA é muito literal, então esse menu precisa ser perfeito, senão ela pode dar pontos onde não deve (como dar nota por desenhar um gato no meio da equação).
  • O Passo 2: A Cozinha (A IA Trabalha)
    Os testes são escaneados. A IA "olha" para a letra manuscrita (como se estivesse lendo um bilhete rabiscado) e tenta corrigir.
    • O Truque da Segurança: Para não errar, a IA não lê cada prova apenas uma vez. Ela lê cinco vezes. É como pedir para cinco cozinheiros diferentes prepararem o mesmo prato e verem se o resultado é o mesmo.
    • A Regra de Ouro: Se a IA der notas diferentes nas 5 vezes, o sistema pega a maior nota (para beneficiar o aluno, já que errar para baixo é pior que errar para cima).
  • O Passo 3: O Chefe Revisa (O Humano)
    Aqui está a mágica. O professor não precisa corrigir tudo do zero. Ele recebe um relatório onde a IA já deu a nota e explicou o porquê. O professor só precisa:
    1. Olhar se a IA parece estar "doida" (dando uma nota estranha).
    2. Confirmar a nota.
    3. Intervir apenas nos casos raros onde a IA errou feio.

3. Os Resultados: Mais Rápido e Justo

O que eles descobriram?

  • Velocidade: O sistema com IA foi 23% mais rápido do que corrigir tudo manualmente. É como ter um assistente que faz o trabalho pesado de leitura, deixando o professor focar apenas no que importa.
  • Justiça: A IA foi tão consistente quanto os professores. Na verdade, em muitos casos, a IA concordou mais com os professores do que os professores concordaram entre si! Isso acontece porque a IA segue o "menu" (a regra) sem ficar cansada ou de mau humor.
  • Segurança: A IA cometeu alguns erros (como qualquer um), mas como o professor revisa os casos estranhos, nenhum aluno foi prejudicado.

4. A Analogia Final: O GPS e o Motorista

Pense na correção de provas como uma viagem de carro:

  • O Professor é o motorista. Ele tem a experiência, o julgamento e a responsabilidade final de chegar ao destino (dar a nota justa).
  • A IA é o GPS. O GPS é incrível: ele calcula a rota mais rápida, avisa sobre buracos e sugere caminhos. Mas, às vezes, o GPS pode sugerir uma rua fechada ou um atalho perigoso.
  • O Sistema Híbrido: O motorista usa o GPS para ir mais rápido e evitar o trânsito (economizar tempo), mas mantém as mãos no volante e os olhos na estrada. Se o GPS disser "vire à direita" e houver um abismo, o motorista (humano) intervém e não vira.

Conclusão

A mensagem principal do artigo é: Não tente substituir o professor pela IA. Em vez disso, use a IA como uma ferramenta poderosa para tirar o peso das costas do professor, permitindo que ele dê feedback rápido e justo para centenas de alunos, mantendo a qualidade humana onde ela é mais necessária. É o melhor dos dois mundos: a velocidade da máquina com o coração do professor.

Receba artigos como este na sua caixa de entrada

Digests diários ou semanais personalizados de acordo com seus interesses. Gists ou resumos técnicos, no seu idioma.

Experimentar Digest →