What Is Missing: Interpretable Ratings for Large Language Model Outputs

O artigo apresenta o sistema de avaliação "What Is Missing" (WIM), que converte feedback textual sobre o que falta em uma resposta de LLM em uma pontuação baseada em similaridade semântica, oferecendo ratings mais discriminativos e interpretáveis para melhorar o aprendizado de preferências em comparação com escalas numéricas tradicionais.

Nicholas Stranges, Yimin Yang

Publicado 2026-03-06
📖 3 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você está treinando um cozinheiro de elite (o Modelo de Linguagem) para criar pratos perfeitos. Até agora, a única forma de dizer ao cozinheiro se ele fez um bom trabalho era dar uma nota de 1 a 10.

O problema? Notas são confusas.
Se o cozinheiro faz um prato "Bom" (nota 8) e outro "Muito Bom" (nota 9), você sabe que o segundo é melhor. Mas se ele faz dois pratos diferentes e ambos recebem nota 8, você não sabe por que eles são iguais. Eles podem ser iguais em qualidade, ou um pode ter faltado sal e o outro faltado tempero, mas a nota final foi a mesma. Para o computador que está aprendendo, isso é um beco sem saída: ele não sabe o que corrigir.

Este artigo apresenta uma nova ideia chamada WIM ("O que está faltando").

A Analogia do "Detetive de Falhas"

Em vez de apenas dar uma nota, imagine que você contrata um Detetive de Falhas para olhar o prato e escrever um bilhete curto dizendo exatamente o que falta.

  • O Cozinheiro (IA): Cria o prato (resposta).
  • O Detetive (Juiz): Lê o prato e escreve: "Falta mencionar que o sal é marinho" ou "Falta explicar por que o fogo está muito alto".
  • A Mágica (WIM): O sistema pega o prato original e o bilhete do detetive e os compara.
    • Se o bilhete diz "Nada falta" (ou é muito curto e direto), o prato é quase perfeito.
    • Se o bilhete é longo e detalhado sobre o que faltou, o prato está longe da perfeição.

O sistema usa uma "régua matemática" (chamada similaridade de cosseno) para medir o quanto o prato e a crítica se parecem. Quanto mais parecidos, melhor o prato.

Por que isso é melhor?

  1. Menos Empates: Com notas de 1 a 10, muitos pratos ficam empatados na nota 7 ou 8. Com o WIM, como a crítica é um texto único, é quase impossível dois pratos diferentes terem exatamente a mesma "nota de falta". Isso dá ao computador um sinal claro de qual é o melhor.
  2. Entendimento Real: Se o computador erra, você não vê apenas um "7". Você lê o bilhete do detetive: "Faltou explicar a física por trás do voo". Isso permite que os pesquisadores entendam exatamente onde a IA está falhando e corrijam o problema. É como ter um mapa do tesouro em vez de apenas um "X" no mapa.
  3. Funciona com Qualquer Cozinheiro: O método não exige mudar a receita inteira (o algoritmo de aprendizado). Você pode usar essa nova forma de dar feedback em qualquer sistema de IA que já existe hoje.

O Resultado na Prática

Os autores testaram isso treinando uma IA (Llama 3) para responder perguntas.

  • Com notas antigas: A IA aprendeu um pouco, mas muitas vezes ficava confusa porque as notas eram muito parecidas.
  • Com WIM: A IA aprendeu muito mais rápido e ficou mais precisa. Ela conseguiu "entender" melhor o que era uma resposta boa porque o feedback era mais rico e menos ambíguo.

Resumo em uma frase

O WIM transforma a avaliação de IA de um "jogo de adivinhação com notas" em um "processo de revisão detalhada", onde o sistema aprende não apenas que errou, mas o que exatamente faltou para acertar, tornando o aprendizado mais rápido e inteligente.