HART: Data-Driven Hallucination Attribution and Evidence-Based Tracing for Large Language Models

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat een Large Language Model (LLM) – zoals de slimme chatbots die we vandaag de dag gebruiken – een zeer goed geïnformeerd, maar soms te zelfverzekerd verhaalverteller is.

Deze verteller kan prachtige verhalen schrijven, feiten samenvatten en vragen beantwoorden. Maar soms, als hij even niet goed oplet, verzonnen hij details. Hij zegt bijvoorbeeld dat Einstein een Nobelprijs won voor het ontwerp van de atoombom, terwijl dat in werkelijkheid niet zo was. Dit noemen we "hallucinaties".

Het probleem is dat we tot nu toe vaak alleen wisten dat er iets mis was, maar niet precies waarom het misging of waar we de juiste informatie konden vinden om het te corrigeren.

Dit paper introduceert HART, een nieuw systeem dat als een detective werkt. In plaats van alleen te zeggen "dit verhaal is onwaar", gaat HART op onderzoek uit om de oorzaak te vinden en het juiste bewijs te leveren.

Hier is hoe HART werkt, vertaald naar alledaagse termen:

1. Het Probleem: De "Goocheltrucs" van de Verteller

Tot nu toe waren methoden om fouten te vinden als een metaalzoeker: ze konden wel zeggen "hier zit een fout", maar ze konden niet vertellen of het een verzonnen naam was, een verkeerde datum, of een logische fout. Ze zagen de fout, maar niet de oorzaak en ze hadden geen bewijs bij de hand om het te ontkrachten.

2. De Oplossing: HART als Detective

HART (Hallucination Attribution Retrieval Tracing) is als een slimme rechercheur die drie dingen tegelijk doet:

Stap 1: De Vlek vinden (Locatie)
HART kijkt naar het verhaal en wijst precies aan welke zin of welk woordstukje (de "span") verdacht is. Het is alsof de detective met een rode stift een zin doorhaalt: "Hier, dit stukje klopt niet."
Stap 2: De Motief bepalen (Oorzaak)
Vervolgens vraagt HART zich af: Waarom heeft de verteller dit verzonnen?
- Heeft hij een naam verward met een andere? (Bijvoorbeeld: Sydney in plaats van Canberra).
- Heeft hij een klein feitje te veel uitvergroot? (Overgeneralisatie).
- Heeft hij iets verzonnen omdat hij dacht dat het logisch klonk? (Verzonnen heuristiek).
  Dit helpt ons te begrijpen hoe de verteller in de fout is gegaan.
Stap 3: Het Bewijs vinden (Traceren)
Dit is het belangrijkste deel. HART gaat niet zomaar een antwoord zoeken. Het zoekt in een enorme bibliotheek (een database van betrouwbare bronnen zoals Wikipedia) naar tegenbewijs.
Het zoekt naar een zin die precies het tegenovergestelde zegt van de fout, maar wel waar is.
- Fout: "Sydney is de hoofdstad."
- HART vindt: "Canberra is de hoofdstad."
  En het koppelt dit bewijs direct aan de fout.

3. Hoe werkt dit technisch? (De "Magie" uitgelegd)

Stel je voor dat HART een tweestaps-recept heeft om het juiste bewijs te vinden:

De Snelle Zoektocht (De Vismarkt):
HART gebruikt een slimme techniek om duizenden documenten in een seconde te scannen. Het zoekt naar documenten die "op elkaar lijken" in betekenis, niet alleen in woorden. Het is alsof je in een grote vismarkt zoekt naar vis die op jouw vis lijkt, zonder elke vis één voor één te bekijken.
De Grondige Controle (De Keurmeester):
De snelle zoektocht geeft een lijst met kandidaten. Maar soms lijken dingen op elkaar terwijl ze het niet zijn. Daarom laat HART een slimme keurmeester (een Cross-Encoder) deze lijst nog eens grondig lezen. Deze keurmeester vergelijkt de vraag en het antwoord zin voor zin om zeker te weten: "Ja, dit is echt het juiste bewijs dat de fout ontkracht."

4. Waarom is dit belangrijk?

Vroeger was het vinden van een fout in een AI-verhaal als het zoeken naar een speld in een hooiberg. Je wist dat er een speld zat, maar je kon hem niet vinden.

Met HART is het alsof je een GPS hebt die je direct naar de speld leidt én je een kaartje geeft met de reden waarom de speld daar ligt.

Betrouwbaarheid: Voor belangrijke gebieden zoals de geneeskunde of het recht is dit cruciaal. Als een AI een verkeerd medicijn voorschrijft, willen we niet alleen weten dat het fout is, maar ook waarom en wat het juiste medicijn is.
Vertrouwen: Het maakt de AI niet alleen slimmer, maar ook eerlijker. Het toont zijn werk en laat zien waar hij zich heeft vergist.

Samenvatting in één zin

HART is een slimme detective die niet alleen zegt "dit verhaal is verzonnen", maar precies aangeeft welk stukje er fout is, waarom de computer die fout maakte, en welk bewijs er is om het verhaal te corrigeren.

Dit maakt Large Language Models veiliger en betrouwbaarder voor alledaags gebruik, van het schrijven van een schoolverslag tot het geven van medisch advies.

HART: Data-Driven Hallucination Attribution and Evidence-Based Tracing for Large Language Models

1. Het Probleem: De "Goocheltrucs" van de Verteller

2. De Oplossing: HART als Detective

3. Hoe werkt dit technisch? (De "Magie" uitgelegd)

4. Waarom is dit belangrijk?

Samenvatting in één zin

Probleemstelling

Methodologie: Het HART Framework

Belangrijkste Bijdragen

Resultaten

Betekenis en Impact

HART: Data-Driven Hallucination Attribution and Evidence-Based Tracing for Large Language Models

1. Het Probleem: De "Goocheltrucs" van de Verteller

2. De Oplossing: HART als Detective

3. Hoe werkt dit technisch? (De "Magie" uitgelegd)

4. Waarom is dit belangrijk?

Samenvatting in één zin

Probleemstelling

Methodologie: Het HART Framework

Belangrijkste Bijdragen

Resultaten

Betekenis en Impact

Meer zoals dit

Speculative Decoding Scaling Laws (SDSL): Throughput Optimization Made Simple

Summarize Before You Speak with ARACH: A Training-Free Inference-Time Plug-In for Enhancing LLMs via Global Attention Reallocation

DeReason: A Difficulty-Aware Curriculum Improves Decoupled SFT-then-RL Training for General Reasoning

MDER-DR: Multi-Hop Question Answering with Entity-Centric Summaries

Markovian Generation Chains in Large Language Models