AdaIAT: Adaptively Increasing Attention to Generated Text to Alleviate Hallucinations in LVLM

Die Arbeit stellt AdaIAT vor, eine adaptive Methode, die durch gezielte Verstärkung der Aufmerksamkeit auf generierten Text Halluzinationen in Large Vision-Language-Modellen signifikant reduziert, ohne dabei die sprachliche Kohärenz oder Vorhersagefähigkeit zu beeinträchtigen.

Li'an Zhong, Ziqiang He, Jibin Zheng, Jin Li, Z. Jane Wang, Xiangui Kang

Veröffentlicht 2026-03-06
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Stell dir vor, du hast einen sehr klugen, aber manchmal etwas verwirrten Freund, der Bilder beschreiben kann. Er ist ein Großes Bild-Sprach-Modell (LVLM). Wenn du ihm ein Foto zeigst, versucht er, dir alles zu erzählen, was er sieht.

Das Problem ist: Manchmal erfindet er Dinge, die gar nicht da sind. Das nennt man Halluzination.

  • Beispiel: Du zeigst ihm ein Foto von einer alten Uhr. Er sagt: „Da ist eine Uhr auf einem Turm." (Richtig). Aber dann fügt er hinzu: „Und daneben stehen zwei Motorräder, die gar nicht da sind." (Falsch/Halluzination).

Bisherige Methoden, um das zu verhindern, waren wie ein übertriebener Lehrer, der dem Freund ständig in die Schulter klopft und schreit: „Achte nur auf das Bild! Vergiss nicht das Bild!"
Das funktioniert zwar, damit er keine neuen Dinge erfindet, aber es hat einen großen Nachteil: Der Freund wird so sehr auf das Bild fixiert, dass er vergisst, was er gerade gesagt hat. Er fängt an, sich zu wiederholen, wie ein kaputtes Platten: „Die Uhr ist auf dem Turm. Die Uhr ist auf dem Turm. Die Uhr ist auf dem Turm." Das ist langweilig und nicht sehr hilfreich.

Die neue Lösung: AdaIAT

Die Forscher aus diesem Papier haben einen cleveren neuen Weg gefunden, den sie AdaIAT nennen. Stell dir das wie einen guten Gesprächspartner vor, der den Freund nicht schreit, sondern ihm hilft, sich selbst zu erinnern.

Hier ist die einfache Erklärung, wie es funktioniert:

1. Die Entdeckung: Der Text ist ein Gedächtnis-Trick

Die Forscher haben beobachtet, dass der Freund, wenn er Dinge wirklich sieht, automatisch auf das zurückgreift, was er gerade eben schon gesagt hat.

  • Wenn er sagt: „Das ist eine Uhr", dann nutzt er diese Information, um den nächsten Satz zu bilden.
  • Wenn er aber etwas erfindet (halluziniert), ignoriert er oft das, was er gerade gesagt hat, und starrt nur ins Leere (oder nur auf das Bild).

Die Analogie: Stell dir vor, du beschreibst ein Bild. Wenn du sagst: „Ich sehe einen Hund", dann hilft dir dieser Gedanke („Hund"), den nächsten Satz zu bilden („Der Hund läuft"). Wenn du aber erfindest, dass da ein Elefant ist, weil du nur auf das Bild starrst und nicht auf deine eigenen Worte hörst, verlierst du den Faden.

2. Die Methode: „Hör mehr auf das, was du sagst!"

Statt dem Freund nur auf das Bild zu zeigen (wie die alten Methoden), sagt AdaIAT: „Hör mehr auf deine eigenen Worte!"

  • IAT (Der einfache Ansatz): Das Modell wird angewiesen, seine Aufmerksamkeit auf den Text zu lenken, den es gerade selbst geschrieben hat. Das hilft ihm, den Kontext zu behalten und nicht zu erfinden. Es verhindert, dass er sich wie ein kaputtes Platten wiederholt.
  • AdaIAT (Der intelligente Ansatz): Das ist die „Pro"-Version. Sie weiß genau, wann sie eingreifen muss.
    • Wenn der Freund gerade alles richtig macht, lässt AdaIAT ihn in Ruhe.
    • Wenn sie merkt, dass er anfängt, die Aufmerksamkeit auf seine eigenen Worte zu verlieren (und vielleicht etwas Erfinden könnte), schaltet sie sanft ein und sagt: „Hey, hör mal kurz auf das, was du gerade gesagt hast!"
    • Außerdem passt sie die Stärke der Hilfe an. Bei manchen „Gedankenwegen" (Aufmerksamkeits-Köpfen) braucht er mehr Hilfe als bei anderen.

Warum ist das so toll?

Stell dir vor, du hast drei Möglichkeiten, deinen Freund zu beschreiben:

  1. Der alte Weg (PAI/HGAI): Der Lehrer schreit „Bild! Bild! Bild!".
    • Ergebnis: Keine Erfindungen, aber er wiederholt sich ständig. „Die Uhr ist da. Die Uhr ist da. Die Uhr ist da." (Langweilig).
  2. Der normale Weg (Greedy): Er macht, was er will.
    • Ergebnis: Manchmal erfindet er Dinge („Da sind Motorräder"), manchmal ist er gut.
  3. Der AdaIAT-Weg: Der Gesprächspartner hilft ihm, auf seine eigenen Worte zu hören.
    • Ergebnis: Er erfindet kaum noch Dinge (weniger Halluzinationen), UND er schreibt flüssige, abwechslungsreiche Sätze. Er vergisst nicht, was er gerade gesagt hat, und wiederholt sich nicht.

Zusammenfassung in einem Satz

AdaIAT ist wie ein selbstkorrigierender Kompass, der dem KI-Modell hilft, sich auf das zu konzentrieren, was es bereits gesagt hat, um sicherzustellen, dass es das Bild korrekt beschreibt, ohne dabei in Wiederholungen zu verfallen oder Dinge zu erfinden. Es ist der perfekte Kompromiss zwischen „Sei genau" und „Sei kreativ".