Mitigating Translationese Bias in Multilingual LLM-as-a-Judge via Disentangled Information Bottleneck

Este artigo apresenta o DIBJudge, um framework de ajuste fino que mitiga o viés de "translationese" em modelos de linguagem multilíngues ao aprender representações essenciais para julgamento e isolar explicitamente fatores espúrios através de um gargalo de informação disjunto.

Hongbin Zhang, Kehai Chen, Xuefen Bai, Youcheng Pan, Yang Xiang, Jinpeng Wang, Min Zhang

Publicado 2026-03-12
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você tem um juiz de talentos muito inteligente, capaz de falar quase todas as línguas do mundo. Esse juiz é uma Inteligência Artificial (IA) chamada "LLM-as-a-Judge". A função dele é ouvir duas respostas para uma pergunta e decidir qual delas é melhor, mais humana e mais correta.

O problema é que, até agora, esse juiz tinha um vício secreto: ele adorava respostas que soavam como "tradução automática".

O Problema: O Vício da "Tradução Robótica"

Os autores do artigo descobriram que, quando o juiz ouvia uma resposta escrita por um humano nativo e outra que era uma tradução feita por máquina (mesmo que a tradução estivesse um pouco estranha ou errada), ele frequentemente escolhia a tradução.

Isso acontecia principalmente em línguas menos comuns (como o Pashto, o Yoruba ou o Kirguiz). Por quê?

  • A Analogia: Imagine que o juiz cresceu ouvindo apenas inglês. Quando ele ouve qualquer outra língua, ele tenta "encaixar" o que ouve na estrutura do inglês.
  • As traduções automáticas, feitas por máquinas, tendem a copiar a estrutura do inglês (como se fosse um molde).
  • Os humanos nativos, por outro lado, falam de forma natural, com expressões que não seguem o molde do inglês.
  • O juiz, confuso, achava que a "tradução robótica" era melhor porque parecia mais familiar e organizada (como o inglês), ignorando que a resposta humana era, na verdade, mais autêntica e correta.

Isso é o que eles chamam de "Viés de Tradução" (Translationese Bias). É como se o juiz dissesse: "Eu prefiro o prato que parece ter sido feito na minha cozinha, mesmo que o prato do chef local seja mais saboroso."

A Solução: O "Filtro de Desembaralhar" (DIBJUDGE)

Para consertar isso, os pesquisadores criaram um novo método de treinamento chamado DIBJUDGE. Eles usaram uma ideia matemática chamada "Gargalo de Informação Desembaralhado".

Vamos usar uma analogia de cozinha e ingredientes:

  1. O Problema Antigo: O juiz misturava tudo na mesma panela. Ele não sabia distinguir o que era "sabor real" (a qualidade da resposta) do que era "cheiro de fábrica" (o estilo de tradução robótica). Ele usava o cheiro de fábrica como pista para julgar a qualidade.
  2. A Nova Solução (DIBJUDGE): Eles criaram uma cozinha com duas bancadas separadas:
    • Bancada da Sabedoria (Representação Robusta): Aqui, o juiz coloca apenas o que é essencial para julgar a resposta: a lógica, a criatividade e a verdade. Tudo o que é "ruído" ou "estilo de tradução" é jogado fora.
    • Bancada do Vício (Representação de Viés): Aqui, eles jogam especificamente os "defeitos" da tradução robótica. Eles ensinam o juiz a identificar: "Ah, isso aqui cheira a tradução automática".

O Truque Mágico:
Eles ensinaram o juiz a não misturar as duas bancadas.

  • Se a resposta tem cheiro de tradução (na bancada do vício), o juiz aprende a ignorar esse cheiro.
  • Ele só olha para a bancada da sabedoria para dar a nota final.

Além disso, eles usaram uma "punição matemática" (uma penalidade de covariância cruzada) que funciona como um ímã de separação. Se o juiz tentar usar o cheiro da tradução para julgar a qualidade, ele leva uma "chamada de atenção" e é forçado a separar as coisas novamente.

O Resultado: Um Juiz Mais Justo

Depois de treinar com esse método, o juiz mudou completamente:

  • Menos Viés: Ele parou de preferir traduções robóticas. Agora, ele valoriza a resposta humana, mesmo que ela seja em uma língua difícil ou pouco comum.
  • Mais Justo: A diferença de tratamento entre línguas ricas (como Inglês e Espanhol) e línguas pobres (como as línguas africanas ou indígenas) diminuiu drasticamente.
  • Melhor Qualidade: Ao focar apenas no que importa (a qualidade real da resposta), o juiz ficou até mais inteligente em geral, não apenas em evitar o viés.

Resumo em Uma Frase

Os pesquisadores ensinaram o "juiz de IA" a parar de julgar pela aparência (se a resposta parece uma tradução perfeita) e a começar a julgar pelo conteúdo real, separando o que é "estilo robótico" do que é "verdade humana", garantindo que todas as línguas do mundo sejam tratadas com a mesma justiça.