Argumentation for Explainable and Globally Contestable Decision Support with LLMs

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een zeer slimme, maar soms wat verwarde assistent hebt die alles over de wereld weet. Deze assistent is een LLM (een groot taalmodel). Hij kan prachtige teksten schrijven en complexe vragen beantwoorden. Maar als je hem vraagt om een levensbelangrijke beslissing te nemen – bijvoorbeeld welke behandeling een patiënt met een hersentumor moet krijgen – dan is hij een beetje als een tovenaar die zijn trucjes niet uitlegt. Je ziet wat hij doet, maar niet waarom. En als hij een fout maakt, is het lastig om te zeggen: "Hé, dat klopt niet, want je hebt dit over het hoofd gezien."

De auteurs van dit paper, Adam, Matthew en Francesca, hebben een oplossing bedacht die ze ArgEval noemen. Laten we uitleggen hoe dit werkt met een paar creatieve vergelijkingen.

1. Het probleem: De "Black Box"

Stel je voor dat de LLM een zwarte doos is. Je stopt een patiëntinformatie erin, en er komt een advies uit. Maar als je vraagt: "Waarom?", geeft hij een antwoord dat klinkt als een gedachtegang, maar dat vaak niet klopt met hoe hij eigenlijk denkt. In de medische wereld is dit gevaarlijk. Als de assistent een fout maakt, kun je die niet makkelijk corrigeren voor de volgende patiënt, omdat je niet weet waar de fout precies zit.

2. De oplossing: ArgEval als een Bouwpakket

In plaats van de LLM te laten "gokken" voor elke nieuwe patiënt, bouwen de auteurs eerst een groot, gestructureerd bouwpakket (een "ontologie" en "argumentatiekaders").

De Ontologie (Het Menu): Eerst laten ze de LLM alle medische richtlijnen lezen en een soort "menu" maken van alle mogelijke behandelingen (zoals chirurgie, straling, medicijnen).
De Argumentatiekaders (De Regels): Voor elk item op dat menu bouwen ze een argumenten-vechtarena. Stel je voor dat voor elke behandeling een tribunal wordt opgezet.
- Er zijn pleitbezorgers (argumenten voor de behandeling).
- Er zijn tegenstanders (argumenten tegen, zoals "te oud" of "te gevaarlijk").
- Elk argument heeft een sterkte (een score).
- Deze arena is vastgelegd in een algemene regel die voor alle patiënten geldt.

3. Hoe het werkt: Van Algemeen naar Specifiek

Wanneer een nieuwe patiënt binnenkomt (bijvoorbeeld een 85-jarige man met een tumor op een lastige plek), gebeurt het volgende:

Het Invullen: De LLM haalt de specifieke feiten uit het patiëntendossier (leeftijd, tumorlocatie, etc.).
Het Aanklikken: Het systeem kijkt naar het algemene bouwpakket. Welke regels zijn van toepassing op deze patiënt?
- Voorbeeld: De regel "Chirurgie is goed" heeft een voorwaarde: "Tumor mag niet te diep zitten". Omdat de tumor van deze patiënt wel diep zit, wordt die regel uitgeschakeld (alsof je een schakelaar omzet).
- De regel "Straling is goed" blijft aan.
De Berekening: Het systeem rekent uit welke overgebleven argumenten het sterkst zijn. De uitkomst is een advies met een duidelijke uitleg: "Chirurgie wordt niet aanbevolen omdat de tumor te diep zit."

4. De Magie: "Wereldwijde" Betwisting (Global Contestability)

Dit is het belangrijkste en coolste deel van het paper.

In oude systemen kon je alleen zeggen: "Deze specifieke patiënt krijgt een verkeerd advies." Maar je kon de basisregels niet makkelijk aanpassen.

Met ArgEval kun je zeggen: "Hé, de regel voor chirurgie is verkeerd opgesteld."

Je past de algemene regel aan in het bouwpakket (bijvoorbeeld: "Chirurgie is alleen goed als de patiënt jonger is dan 70").
Het mooie effect: Zodra je die ene regel aanpast, werkt het advies voor alle toekomstige patiënten direct beter. Je hoeft niet duizenden gevallen opnieuw te berekenen; je past gewoon de "moeder-regel" aan.

De Analogie:
Stel je voor dat je een recept hebt voor een taart.

Oude manier: Als de taart voor de ene klant te zoet is, maak je die taart opnieuw. Als de volgende klant ook een minder zoete taart wil, moet je het recept opnieuw uitleggen.
ArgEval manier: Je past het recept zelf aan (minder suiker). Nu wordt elke taart die je vanaf nu bakt, automatisch minder zoet. En als iemand vraagt "Waarom is deze taart minder zoet?", kun je precies laten zien welk ingrediënt je hebt aangepast in het recept.

5. Wat hebben ze bewezen?

Ze hebben ArgEval getest op een moeilijke medische taak: het kiezen van de beste behandeling voor een agressieve hersentumor (glioblastoma).

Resultaat: Het systeem deed het net zo goed als de slimste andere methoden, maar gebruikte veel minder rekenkracht (en dus minder tijd en geld).
Betwisting: In een proefje hebben ze één foutje in de regels gevonden en aangepast. Hierdoor verbeterde het advies voor alle patiënten in hun testgroep direct.

Conclusie

ArgEval is als het geven van een open boek aan een slimme assistent. In plaats van dat hij raadt, volgt hij een duidelijk, controleerbaar stappenplan. Als hij een fout maakt, kun je niet alleen de fout voor die ene keer herstellen, maar kun je de basisregels aanpassen zodat hij in de toekomst nooit meer diezelfde fout maakt. Dit maakt het veel veiliger en betrouwbaarder om AI in de zorg (en andere belangrijke gebieden) te gebruiken.

Each language version is independently generated for its own context, not a direct translation.

Probleemstelling

Grote Taalmodellen (LLMs) tonen sterke algemene capaciteiten, maar hun inzet in hoog-risico domeinen (zoals de gezondheidszorg) wordt belemmerd door twee hoofdzaken:

Ondoorzichtigheid (Opacity): LLMs zijn "black boxes" die moeilijk te verklaren zijn. Bestaande methoden zoals Chain-of-Thought (CoT) blijken vaak onbetrouwbaar ("unfaithful") omdat ze de werkelijke interne redenering van het model niet correct weergeven.
Beperkte Betwisting (Contestability): Bestaande argumentatie-gebaseerde benaderingen (zoals ArgLLMs en ArgRAG) ondersteunen slechts lokale betwisting. Dit betekent dat gebruikers alleen een specifieke instantie (een enkel geval) kunnen corrigeren. De onderliggende besluitvormingslogica blijft onveranderd, waardoor het model dezelfde fouten bij toekomstige gevallen kan blijven maken.

Het paper stelt dat er een behoefte is aan een systeem dat niet alleen betrouwbare uitleg biedt, maar ook globale betwisting mogelijk maakt, waarbij correcties op één geval de algemene logica en toekomstige beslissingen verbeteren.

Methodologie: ArgEval

De auteurs introduceren ArgEval, een raamwerk dat verschuift van case-specifiek redeneren naar gestructureerde evaluatie van algemene besluitvormingsopties. Het proces verloopt in twee hoofdfasen:

1. Algemene Taakverwerking (General Task Processing)

In deze fase wordt een generiek kennismodel opgebouwd dat onafhankelijk is van specifieke patiëntengevallen:

Ontwerp van Besluitruimte (Decision Ontology Construction): Het systeem verwerkt natuurlijke taal beleidsdocumenten (bijv. klinische richtlijnen) om een gestructureerde ontologie van beschikbare beslissingsopties te bouwen.
Constructie van Algemene QBAF's: Voor elke optie in de ontologie wordt een Quantitatief Bipolair Argumentatiekader (QBAF) gegenereerd.
- Een QBAF bestaat uit argumenten, aanvalsrelaties ( $R^-$ ), ondersteuningsrelaties ( $R^+$ ) en een basisscore ( $\tau$ ).
- LLMs worden gebruikt om argumenten voor en tegen een optie te "minen" (graven) en hun intrinsieke sterkte te schatten.
- Cruciaal: Elk argument krijgt een formele voorwaarde (bijv. JSON-schema) die specificeert wanneer het argument van toepassing is op basis van geval-parameters.
- Dit resulteert in een set van algemene QBAF's die de universele logica van het domein vastleggen.

2. Case-Specifieke Inference

Wanneer een nieuw geval (bijv. een patiënt) wordt geanalyseerd:

Parameter Extractie: De LLM extrahert gestructureerde parameters uit de patiëntbeschrijving, geleid door het globale schema.
Instantiatie: De algemene QBAF's worden geïnstantieerd voor het specifieke geval. Argumenten waarvan de voorwaarden niet worden voldaan (bijv. een argument dat alleen geldt voor jonge patiënten, terwijl de patiënt 85 is) worden verwijderd, samen met hun afgeleide relaties.
Berekening: Een graduele semantiek (DF-QuAD) berekent de uiteindelijke sterkte van de argumenten. De sterkte van de wortel-argument (de beslissingsoptie) levert een aanbevelingsscore op.
Uitleg: Het geïnstantieerde QBAF fungeert als een faithful explanation (betrouwbare uitleg) van de beslissing.

Globale Betwisting

Dit is het unieke kenmerk van ArgEval. Gebruikers kunnen het geïnstantieerde kader inspecteren en fouten corrigeren door:

De basisscores van argumenten aan te passen.
Argumenten toe te voegen of te verwijderen.
De parameter-schema's of de ontologie zelf te wijzigen.
Omdat de geïnstantieerde QBAF's direct corresponderen met de algemene QBAF's, hebben deze wijzigingen directe invloed op alle toekomstige gevallen die aan dezelfde voorwaarden voldoen. Dit transformeert lokale correcties in globale verbeteringen.

Kernbijdragen

ArgEval Framework: Een nieuw raamwerk dat LLMs combineert met formele argumentatie voor betrouwbare, uitlegbare en globaal betwistbare besluitvorming.
Shift naar Globale Logica: In tegenstelling tot eerdere werken die alleen per geval redeneren, bouwt ArgEval eerst een universeel argumentatiekader op, wat consistentie en globale correctie mogelijk maakt.
Toepassing in de Gezondheidszorg: Succesvolle toepassing op het aanbevelen van behandelingen voor glioblastoom (een agressieve hersentumor), waarbij het systeem zich richt op klinische richtlijnen.
Efficiëntie: Het systeem bereikt concurrerende prestaties met een fractie van de rekenkosten van bestaande methoden, omdat de zware redenering (het bouwen van het QBAF) slechts één keer per taak gebeurt en niet per geval.

Resultaten

De auteurs evalueerden ArgEval op een dataset van 360 patiëntvignetten voor glioblastoom, vergeleken met baselines (standaard LLMs en ArgLLMs-O).

Prestaties: De beste varianten van ArgEval bereikten een Label Match Rate (LMR) van 0,8818 en een NDCG (Normalised Discounted Cumulative Gain) van 0,9771. Dit is vergelijkbaar met of beter dan de baselines.
Efficiëntie: ArgEval is aanzienlijk sneller en goedkoper. De duurste variant van ArgEval vereiste ongeveer 2,9x minder tokens dan de goedkoopste standaard LLM-versie en 8,7x minder dan de goedkoopste ArgLLMs-O-versie.
Impact van Betwisting (Case Study): In een experiment werd een foutieve aanbeveling voor één patiënt gecorrigeerd door de basisscores in het algemene QBAF aan te passen.
- Resultaat: Deze enkele correctie leidde tot een significante verbetering in de prestaties op de hele dataset (LMR steeg van 0,8009 naar 0,8784). Dit bewijst dat lokale betwisting effectief kan leiden tot globale modelverbetering.

Betekenis en Conclusie

ArgEval biedt een oplossing voor de "black box"-problematiek van LLMs in kritieke domeinen. Door te verschuiven van puur generatieve antwoorden naar een gestructureerde, argumentatie-gebaseerde aanpak, biedt het:

Vertrouwen: Uitleggen is inherent betrouwbaar omdat het gebaseerd is op de zichtbare logica van het argumentatiekader.
Controle: Menselijke experts kunnen de logica niet alleen voor één geval, maar voor het hele systeem corrigeren.
Duurzaamheid: Het systeem verbetert zichzelf door feedback, wat essentieel is voor veilige AI in de zorg.

Het paper concludeert dat ArgEval een sterke balans biedt tussen prestaties, kosten en de noodzakelijke eigenschappen van uitlegbaarheid en controleerbaarheid voor hoog-risico toepassingen.