Mitigating Translationese Bias in Multilingual LLM-as-a-Judge via Disentangled Information Bottleneck

Die Arbeit stellt DIBJudge vor, ein Feinabstimmungsframework, das mittels eines entkoppelten Informationsbottlenecks und einer Kreuzkovarianzstrafe die systematische Verzerrung von mehrsprachigen LLMs zugunsten maschinell übersetzter Texte („Translationese") effektiv reduziert.

Hongbin Zhang, Kehai Chen, Xuefen Bai, Youcheng Pan, Yang Xiang, Jinpeng Wang, Min Zhang

Veröffentlicht 2026-03-12
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Hier ist eine einfache Erklärung der Forschung, als würde man sie einem Freund beim Kaffee erzählen – ohne komplizierte Fachbegriffe, aber mit ein paar bildhaften Vergleichen.

Das Problem: Der „Übersetzungs-Akzent"

Stell dir vor, du hast einen sehr klugen Richter, der aus einem großen Buch (einem KI-Modell) lernt. Dieser Richter soll entscheiden, welche Antwort auf eine Frage besser ist. Das Problem ist: Dieser Richter hat eine seltsame Vorliebe.

Wenn er zwei Antworten vergleicht – eine, die ein Mensch geschrieben hat, und eine, die von einer Maschine übersetzt wurde – bevorzugt er fast immer die maschinelle Übersetzung. Auch wenn die menschliche Antwort eigentlich besser oder genauer ist!

Das passiert besonders stark bei Sprachen, die in der KI-Welt weniger „bekannt" sind (wie z. B. Swahili, Jiddisch oder bestimmte indigene Sprachen). Man nennt das „Translationese Bias" (Übersetzungs-Bias).

Die Analogie:
Stell dir vor, du bist ein Musik-Juror. Wenn dir jemand ein Lied vorsingt, das von einem Profi aufgenommen wurde, und daneben ein Lied, das von einem Roboter gesungen wurde, der alles perfekt im Takt hält, aber ohne Seele, dann sagst du vielleicht: „Der Roboter klingt sauberer!" und vergibst ihm den Punkt. Dabei war das menschliche Lied eigentlich emotionaler und besser. Der Richter wird von der „sauberen, maschinellen Struktur" getäuscht und ignoriert die echte Qualität.

Warum passiert das?

Die Forscher haben herausgefunden, dass der Richter zwei falsche Hinweise (Spuren) benutzt, um zu entscheiden:

  1. Der „Englisch-Filter": Die KI wurde hauptsächlich mit englischen Texten trainiert. Wenn eine Übersetzung sehr stark nach einer englischen Satzstruktur klingt (auch wenn sie in einer anderen Sprache ist), denkt der Richter: „Aha, das ist gut!" Er verwechselt also „klingt wie Englisch" mit „ist gut".
  2. Der „Vorhersehbarkeits-Trick": Maschinelle Übersetzungen sind oft sehr vorhersehbar und folgen klaren Mustern. Der Richter mag diese Sicherheit und denkt: „Das muss richtig sein, weil es so einfach zu berechnen ist." Er vergisst dabei, dass echte menschliche Sprache oft überraschend und kreativ ist.

Die Lösung: Der „Entwirrer" (DIBJUDGE)

Die Forscher haben eine neue Methode entwickelt, die sie DIBJUDGE nennen. Man kann sich das wie eine sehr clevere Küchen-Kontrolle vorstellen.

Stell dir vor, der Richter ist ein Koch, der Gerichte bewertet. Bisher hat er einfach alles in einen Topf geworfen und geschmeckt. Dabei hat er den „Maschinen-Geschmack" (die Übersetzungs-Artefakte) mit dem „echten Geschmack" (der inhaltlichen Qualität) verwechselt.

Wie DIBJUDGE funktioniert:

  1. Der Trenn-Trichter (Information Bottleneck):
    Der neue Richter hat einen speziellen Trichter vor sich. Wenn eine Antwort hereinkommt, wird sie durch diesen Trichter geschleust.

    • Der Trichter filtert alles heraus, was nur nach „Maschine" schmeckt (die Übersetzungs-Spuren).
    • Aber er behält das Wichtigste (die eigentliche Bedeutung und Qualität) zurück.
  2. Zwei separate Schubladen:
    Statt alles zu mischen, hat der Richter jetzt zwei Schubladen:

    • Schublade A (Robust): Hier landen nur die echten, wichtigen Informationen. „Ist die Antwort hilfreich? Ist sie wahr?"
    • Schublade B (Bias): Hier landen alle die störenden Signale wie „Klingt das wie eine Übersetzung?" oder „Ist das zu vorhersehbar?".
    • Der Clou: Der Richter wird trainiert, diese beiden Schubladen strikt zu trennen. Er darf die Inhalte aus Schublade B nicht benutzen, um die Qualität zu bewerten. Er muss sich nur auf Schublade A konzentrieren.
  3. Der „Anti-Kleber":
    Um sicherzustellen, dass die beiden Schubladen wirklich getrennt bleiben, gibt es eine Regel: „Wenn etwas in Schublade B ist, darf es nicht in Schublade A sein." Das verhindert, dass die KI wieder alte Tricks benutzt.

Das Ergebnis

Wenn man diesen neuen, entwirrenden Richter testet, passiert Magisches:

  • Fairness: Er bewertet menschliche Texte und maschinelle Übersetzungen viel fairer. Er merkt nicht mehr sofort „Oh, das ist eine Übersetzung, also ist es gut".
  • Besonders gut für kleine Sprachen: Sprachen, die bisher benachteiligt waren (weil sie weniger Daten haben), werden jetzt viel besser bewertet. Der Richter hört auf, nur das zu mögen, was nach Englisch klingt.
  • Besser als die alten Methoden: Selbst wenn man den Richter mit den besten verfügbaren Modellen vergleicht (wie GPT-4o), schneidet diese neue Methode besser ab, besonders wenn es um Gerechtigkeit geht.

Zusammenfassung in einem Satz

Die Forscher haben einen KI-Richter gebaut, der gelernt hat, den „Maschinen-Akzent" von Übersetzungen herauszufiltern, damit er endlich die echte Qualität einer Antwort sieht – egal ob sie von einem Menschen oder einer Maschine stammt und egal welche Sprache gesprochen wird.

Es ist, als würde man einem Richter eine Brille aufsetzen, die ihm erlaubt, den Inhalt eines Textes zu sehen, statt nur auf die Art und Weise zu achten, wie er geschrieben wurde.