Causal Inference with Generative Artificial Intelligence: Application to Texts as Treatments

Dit artikel stelt een Generative AI-Powered Inference (GPI) methodologie voor die gebruikmaakt van grote taalmodellen om behandelingen te genereren en hun interne representaties te benutten voor een nauwkeurigere en efficiëntere schatting van causale effecten uit ongestructureerde tekst, waardoor de noodzaak om causale representaties direct uit data te leren wordt geëlimineerd en veelvoorkomende uitdagingen zoals confounding en overlap-schendingen worden overwonnen.

Oorspronkelijke auteurs: Kosuke Imai, Kentaro Nakamura

Gepubliceerd 2026-06-12
📖 5 min leestijd🧠 Diepgaand

Oorspronkelijke auteurs: Kosuke Imai, Kentaro Nakamura

Oorspronkelijk artikel gelicentieerd onder CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). Dit is een AI-gegenereerde uitleg van het onderstaande artikel. Het is niet geschreven of goedgekeurd door de auteurs. Raadpleeg het oorspronkelijke artikel voor technische nauwkeurigheid. Lees de volledige disclaimer

Stel je voor dat je een detective bent die probeert uit te vogelen of een specifiek detail in een verhaal de gevoelens van mensen over een personage verandert. Laten we zeggen dat je wilt weten: Maakt het hebben van een militaire achtergrond dat kiezers een politicus leuker vinden?

Het probleem is dat verhalen uit het echte leven rommelig zijn. Een politicus met een militaire achtergrond kan toevallig ook ouder zijn, een ander opleidingsniveau hebben of een biografie met een meer emotionele toon schrijven. Als je gewoon twee willekeurige biografieën vergelijkt, kun je niet zien of de kiezers de kandidaat leuk vonden vanwege het militaire deel of vanwege het onderwijs-deel. In de wetenschap noemen we deze rommelige extra details "confounders" (verstorende variabelen).

Traditioneel proberen onderzoekers dit op te lossen door computers te gebruiken om de tekst te "lezen" en te raden wat de confounders zijn. Maar dit is als het proberen schoon te maken van een beslagen raam door te gokken waar het vuil zit; het is moeilijk, traag en vaak onnauwkeurig.

Dit artikel introduceert een nieuwe tool genaamd GPI (Generative-AI Powered Inference). Zo werkt het, met behulp van een eenvoudige analogie:

De Magische Kopieermachine (De GenAI)

In plaats van alleen bestaande verhalen te lezen, gebruiken de onderzoekers een "Magische Kopieermachine" (een Large Language Model, of LLM) om de verhalen voor hen te schrijven.

  1. De Prompt: De onderzoeker vertelt de machine: "Schrijf een biografie van een politicus die een militaire achtergrond heeft." Daarna vertelt de onderzoeker: "Schrijf een biografie van een politicus die geen militaire achtergrond heeft."
  2. Het Geheime Blauwdruk: Hier is de superkracht. Wanneer de AI het verhaal schrijft, spuugt de AI niet alleen woorden uit; de AI creëert een verborgen, interne "blauwdruk" (een wiskundige representatie) van precies wat het heeft geschreven.
  3. De Truc: Omdat de AI het verhaal heeft geschreven, hebben de onderzoekers toegang tot deze perfecte, verborgen blauwdruk. Ze weten precies wat de AI in de tekst heeft gestopt om het over het leger te laten gaan, en ze weten wat de AI heeft toegevoegd voor alles wat daarmee te maken heeft (zoals onderwijs of toon).

De "Deconfounder" (Het Filter)

De onderzoekers gebruiken deze perfecte blauwdruk om een speciaal filter te bouwen dat een Deconfounder wordt genoemd.

  • De Oude Manier: Stel je voor dat je rode en blauwe knikkers probeert te scheiden die aan elkaar geplakt zitten. Je moet raden hoe je ze uit elkaar kunt trekken.
  • De GPI-Manier: Omdat de AI het verhaal heeft geschreven, hebben de onderzoekers de "gebruiksaanwijzing". Ze kunnen naar de blauwdruk kijken en zeggen: "Oké, dit deel van de blauwdruk is het ingrediënt 'Militaire achtergrond', en dat andere deel van de blauwdruk is het ingrediënt 'Onderwijs'." Ze kunnen het militaire deel wiskundig isoleren zonder het onderwijs-deel te verstoren.

Dit stelt hen in staat om te vragen: "Als we het onderwijs en de toon exact hetzelfde houden, maar alleen het militaire deel veranderen, hoe verandert dan de score van de kiezer?"

Waarom dit beter is

Het artikel beweert dat deze methode voordelen heeft ten opzien van een handbediende rekenmachine door te upgraden naar een supercomputer, om twee belangrijke redenen:

  1. Nauwkeurigheid: Omdat ze de werkelijke interne blauwdruk van de AI gebruiken in plaats van te gokken over de betekenis van de tekst, krijgen ze een veel duidelijker antwoord. In hun tests had hun methode minder "ruis" (fouten) en gaf het veel betrouwbaardere resultaten dan de beste bestaande methoden.
  2. Snelheid: De oude methoden zijn als het proberen op te lossen van een enorme puzzel door naar elk afzonderlijk stukje te kijken. De nieuwe methode is als het hebben van de afbeelding op de doos; het lost het probleem ongeveer 100 keer sneller op.

De "Text Reuse" Twist

De onderzoekers ontdekten ook een slimme afkorting. Als je een bestaande biografie neemt en de AI vraagt om "deze exacte tekst te herschrijven", creëert de AI een nieuwe, perfecte blauwdruk voor die oude tekst. Dit betekent dat je niet eens nieuwe verhalen vanaf nul hoeft te genereren; je kunt oude data gebruiken, deze aan de AI voeren, en dezelfde hoogwaardige resultaten krijgen.

De Kern van het Verhaal

Het artikel betoogt dat door Generatieve AI niet alleen te gebruiken om tekst te genereren, maar ook om de verborgen structuur van die tekst te begrijpen, we eindelijk de complexe web van oorzaak en gevolg in de sociale wetenschappen kunnen ontwarren.

  • Het Doel: Het ware effect van één specif ding (zoals militaire dienst) op een uitkomst (zoals de tevredenheid van de kiezer) meten.
  • Het Probleem: Andere zaken (confounders) zijn erdoorheen gemengd.
  • De Oplossing: Gebruik AI om de tekst te genereren of te herschrijven, pak de "geheime blauwdruk", en gebruik die om de oorzaak perfect te scheiden van de ruis.

De auteurs testten dit op echte kiezersonderzoeken en vonden dat, ja, een militaire achtergrond kiezers inderdaad warmer doet voelen tegenover kandidaten, en ze waren in staat dit met veel meer vertrouwen en snelheid te bewijzen dan voorheen. Ze merken ook op dat dezelfde logica in de toekomst ook voor afbeeldingen en video's zou kunnen werken, mits de AI ze met een vergelijkbare precisie kan genereren.

Verdrinkt u in papers in uw vakgebied?

Ontvang dagelijkse digests van de nieuwste papers die bij uw onderzoekswoorden passen — met technische samenvattingen, in uw taal.

Probeer Digest →