HART: Data-Driven Hallucination Attribution and Evidence-Based Tracing for Large Language Models

O artigo propõe o HART, um novo framework baseado em dados para atribuição de alucinações e rastreamento de evidências em Grandes Modelos de Linguagem, que supera as abordagens existentes ao formalizar o problema em quatro etapas estruturadas e introduzir o primeiro conjunto de dados organizado para avaliação causal e interpretável de erros de geração.

Shize Liang, Hongzhi Wang

Publicado 2026-03-09
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você pediu a um assistente de IA (como um robô superinteligente) para escrever um texto sobre Albert Einstein. O robô escreve um texto lindo, mas, no meio dele, inventa que Einstein ganhou um Prêmio Nobel por algo que nunca aconteceu e que ele trabalhou em um projeto secreto de armas nucleares em Princeton.

O texto parece real, mas é uma alucinação: uma mentira convincente.

Até hoje, os pesquisadores tentavam apenas dizer: "Ei, aqui tem um erro!". Mas o novo trabalho que você pediu para explicar, chamado HART, vai muito além. Ele não apenas aponta o erro; ele age como um detetive particular que investiga por que o erro aconteceu e onde está a verdade real.

Aqui está uma explicação simples de como o HART funciona, usando analogias do dia a dia:

1. O Problema: O "Robô Alucinado"

As IAs são ótimas em escrever, mas às vezes elas "alucinam". É como se um aluno muito estudioso, mas um pouco sonhador, escrevesse uma redação. Ele sabe a matéria, mas às vezes mistura fatos reais com invenções da própria cabeça.

  • O problema antigo: Os métodos anteriores eram como um professor que apenas riscava a frase errada com uma caneta vermelha e dizia "Isso está errado". Eles não explicavam por que o aluno errou nem mostravam o livro de onde a informação correta vinha.

2. A Solução: O Detetive HART

O HART (Hallucination Attribution Retrieval Tracing) é um sistema que transforma a investigação de erros em um processo de 4 etapas, como se fosse uma investigação policial:

Etapa 1: Localizar a "Mão na Massa" (Localização do Trecho)

O HART não olha para o texto inteiro de uma vez. Ele usa uma lupa para encontrar exatamente qual palavra ou frase é a mentira.

  • Analogia: É como um detetive que não diz "o crime aconteceu na casa", mas aponta: "O suspeito estava na sala, atrás do sofá, às 14h".

Etapa 2: Descobrir o "Motivo" (Atribuição do Mecanismo)

Aqui está a grande inovação. O HART pergunta: "Por que o robô inventou isso?". Ele classifica o erro em categorias específicas:

  • Invenção Pura: O robô criou algo do nada (como inventar um livro que Einstein nunca escreveu).

  • Confusão de Identidade: Misturar duas pessoas (achar que Einstein trabalhou com Oppenheimer em algo que não foi).

  • Generalização Exagerada: Pegar uma verdade pequena e esticá-la até virar mentira.

  • Vazamento de Contexto: O robô usou uma informação que estava na pergunta, mas que não deveria estar na resposta.

  • Falha de Raciocínio: O robô tentou deduzir algo e chegou a uma conclusão lógica, mas falsa.

  • Analogia: Em vez de apenas prender o ladrão, o detetive descobre se ele roubou por fome, por vingança ou por acidente. Isso ajuda a entender a "personalidade" do erro.

Etapa 3: Buscar a "Prova Real" (Busca de Evidências)

Depois de achar o erro e o motivo, o HART vai até uma enorme biblioteca digital (a internet, Wikipédia, sites oficiais) para encontrar o documento que prova que o robô estava errado.

  • Como funciona: Ele não apenas procura palavras-chave. Ele entende o significado. Se o robô diz "Sydney é a capital da Austrália", o HART busca documentos que dizem "Canberra é a capital", mesmo que a palavra "Sydney" não apareça no documento de prova.
  • Analogia: É como se você tivesse uma acusação falsa e o detetive trouxesse não apenas a foto do crime, mas o registro civil, a testemunha e o vídeo de segurança que provam sua inocência.

Etapa 4: O Relatório Final (Rastreamento Causal)

O HART entrega um pacote completo:

  1. Onde está a mentira.
  2. Por que ela aconteceu (o mecanismo).
  3. Qual é a verdade real e onde encontrá-la.

3. Por que isso é importante?

Imagine que você usa uma IA para:

  • Medicina: O robô diz que um remédio cura uma doença que ele não cura. O HART não apenas diz "erro", mas mostra o estudo médico real que prova o contrário.
  • Direito: O robô cita uma lei que não existe. O HART traz o código de leis real.

Sem o HART, você teria que confiar na sua própria intuição para verificar se o robô está mentindo. Com o HART, o robô é obrigado a "mostrar o trabalho" e a fonte da verdade, tornando-o muito mais confiável para coisas sérias.

Resumo em uma frase

O HART é como um tradutor e detetive que pega as mentiras convincentes de uma IA, explica exatamente por que ela inventou aquilo e entrega, na mão, a prova real de onde está a verdade, transformando um "achismo" em uma investigação factual.