Disentangling Prompt Element Level Risk Factors for Hallucinations and Omissions in Mental Health LLM Responses

Each language version is independently generated for its own context, not a direct translation.

De "Geestelijke Gezondheids-Test": Waarom AI soms vergeet wat er echt belangrijk is

Stel je voor dat je een zeer slimme, maar nog jonge assistent hebt die je helpt met vragen over je geestelijke gezondheid. Hij is snel, beleefd en kent veel feiten. Maar zoals elke leerling, maakt hij soms fouten. Deze fouten zijn van twee soorten:

De "Verzonnen Feitjes" (Hallucinaties): Hij vertelt je iets dat klinkt als een waarheid, maar helemaal niet waar is (bijvoorbeeld: "Neem dit medicijn, het is wonderbaarlijk," terwijl dat medicijn niet bestaat).
Het "Stille Vergeten" (Omissies): Dit is gevaarlijker. Hij zegt niets verkeerd, maar hij vergeet iets cruciaals te zeggen. Bijvoorbeeld: als iemand zegt dat ze zich zo slecht voelen dat ze niet meer willen leven, zegt de AI: "Dat klinkt zwaar, probeer te wandelen," en vergeet dan volledig om te zeggen: "Bel direct een hulplijn, want dit is een noodgeval."

De onderzoekers van dit paper wilden weten: Waarom maakt deze AI deze fouten? Is het omdat de persoon die vraagt een bepaalde achtergrond heeft (bijvoorbeeld leeftijd of beroep), of ligt het aan hoe de vraag gesteld is?

Om dit uit te zoeken, bouwden ze een speciaal testkader genaamd UTCO. Dit staat voor U (Gebruiker), T (Onderwerp), C (Context) en O (Toon).

De Test: Een Kookpand met 4 Ingrediënten

Stel je voor dat je een gerecht kookt. Je hebt vier ingrediënten:

U (Gebruiker): Wie vraagt het? (Een ouder, een tiener, een man, een vrouw?)
T (Onderwerp): Waar gaat het over? (Depressie, angst, suïcidale gedachten?)
C (Context): Hoe ziet de situatie eruit? (Is het een korte zin of een lang verhaal? Is het een dagboekfragment of een formele vraag?)
O (Toon): Wat is de stemming? (Angstig, hopeloos, boos, of gewoon neutraal?)

De onderzoekers lieten de AI (een model genaamd Llama 3.3) 2.075 verschillende vragen beantwoorden. Ze veranderden systematisch één ingrediënt per keer, terwijl ze de andere drie constant hielden. Het was alsof ze een enorme hoeveelheid proefjes deden om te zien welk ingrediënt de "recept" (het antwoord) bedierf.

Wat Vonden Ze? De Grote Verassingen

1. Het is niet de persoon, maar de manier van vragen.
Je zou denken dat de AI misschien slechter reageert op vragen van bepaalde mensen (bijvoorbeeld jongeren of mensen uit een specifieke etnische groep). Maar dat bleek niet het geval. De achtergrond van de gebruiker maakte weinig verschil.

2. Het verhaal en de emotie zijn de boosdoeners.
De echte problemen kwamen voort uit Context (C) en Toon (O).

Lange, verwarrende verhalen: Als iemand een lang, emotioneel verhaal vertelde met veel details en onduidelijke zinsdelen, vergat de AI vaak de veiligheidsinstructies. Het was alsof de AI zo druk was met het begrijpen van het verhaal, dat hij de noodknop over het hoofd zag.
Hoge emotie: Als iemand "hopeloos" of "angstig" klonk, neigde de AI naar een vriendelijk, troostend antwoord, maar vergeten ze de harde, noodzakelijke feiten (zoals "bel 112").
Suïcidale gedachten: Hier was het risico op vergeten informatie het grootst. Bij vragen over zelfdoding miste de AI in 36% van de gevallen de cruciale veiligheidsinformatie.

3. De "Stille Dood" is gevaarlijker dan de "Verzonnen Feitjes".
De AI maakte vaker de fout van het "vergeten" (13,2%) dan het "verzonnen" (6,5%).

Analogie: Als de AI een verzonnen medicijn noemt, merk je dat misschien snel ("Wacht, dat bestaat niet!"). Maar als hij vergeet te zeggen dat je hulp moet zoeken, klinkt zijn antwoord perfect en vriendelijk. De gebruiker denkt: "Ah, het is oké," terwijl het juist heel gevaarlijk is. Dit is een "stille fout" die je niet direct ziet.

De Oplossing: Hoe maken we het veiliger?

De onderzoekers concluderen dat we onze tests voor AI moeten veranderen.

Geen korte, droge vragen meer: Tot nu toe testten we AI's met korte vragen zoals "Wat is depressie?". Maar mensen in nood schrijven lange, emotionele verhalen. We moeten de AI testen met die echte, rommelige verhalen.
Focus op veiligheid, niet op vriendelijkheid: De AI moet leren dat als iemand in nood zit (hoge emotie, lange tekst), hij eerst de veiligheidsinformatie moet geven, zelfs als de gebruiker dat niet expliciet vraagt.
De "Verduidelijkings-knop": Als de vraag te vaag of te emotioneel is, moet de AI niet raden, maar terugvragen: "Klinkt alsof je het zwaar hebt. Bedoel je dat je nu in gevaar bent?"

Conclusie in één zin

Deze AI is niet dom door wie er vraagt, maar raakt in de war door hoe mensen in nood hun verhaal vertellen; daarom moeten we hem trainen om in die chaotische, emotionele momenten vooral de veiligheidsbril op te zetten, in plaats van alleen maar een aardig verhaal te vertellen.

Disentangling Prompt Element Level Risk Factors for Hallucinations and Omissions in Mental Health LLM Responses

De Test: Een Kookpand met 4 Ingrediënten

Wat Vonden Ze? De Grote Verassingen

De Oplossing: Hoe maken we het veiliger?

Conclusie in één zin

Probleemstelling

Methodologie

Belangrijkste Resultaten

Belangrijkste Bijdragen

Betekenis en Implicaties

Disentangling Prompt Element Level Risk Factors for Hallucinations and Omissions in Mental Health LLM Responses

De Test: Een Kookpand met 4 Ingrediënten

Wat Vonden Ze? De Grote Verassingen

De Oplossing: Hoe maken we het veiliger?

Conclusie in één zin

Probleemstelling

Methodologie

Belangrijkste Resultaten

Belangrijkste Bijdragen

Betekenis en Implicaties

Meer zoals dit

One Pic is All it Takes: Poisoning Visual Document Retrieval Augmented Generation with a Single Image

The Geometric Anatomy of Capability Acquisition in Transformers

ASCAT: An Arabic Scientific Corpus and Benchmark for Advanced Translation Evaluation

Semantic Shifts of Psychological Concepts in Scientific and Popular Media Discourse: A Distributional Semantics Analysis of Russian-Language Corpora

Detecting Abnormal User Feedback Patterns through Temporal Sentiment Aggregation