Causal Inference with Generative Artificial Intelligence: Application to Texts as Treatments

Este artículo propone una metodología de Inferencia Impulsada por IA Generativa (GPI, por sus siglas en inglés) que aprovecha los modelos de lenguaje de gran tamaño para generar tratamientos y utilizar sus representaciones internas para una estimación de efectos causales más precisa y eficiente a partir de texto no estructurado, eliminando así la necesidad de aprender representaciones causales directamente de los datos y superando desafíos comunes como el confusión y las violaciones de la superposición.

Autores originales: Kosuke Imai, Kentaro Nakamura

Publicado 2026-06-12
📖 4 min de lectura☕ Lectura para el café

Autores originales: Kosuke Imai, Kentaro Nakamura

Artículo original bajo licencia CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). Esta es una explicación generada por IA del artículo a continuación. No ha sido escrita ni avalada por los autores. Para mayor precisión técnica, consulte el artículo original. Leer descargo de responsabilidad completo

Imagina que eres un detective tratando de descubrir si un detalle específico en una historia cambia cómo se sienten las personas respecto a un personaje. Digamos que quieres saber: ¿Tener una trayectoria militar hace que los votantes aprecien más a un político?

El problema es que las historias de la vida real son complicadas. Un político con una trayectoria militar también podría ser, por casualidad, mayor, tener un nivel educativo diferente o escribir su biografía con un tono más emocional. Si solo comparas dos biografías al azar, no puedes saber si los votantes apreciaron al candidato por la parte militar o por la parte de la educación. En ciencia, llamamos a estos detalles extra complicados "confundidores".

Tradicionalmente, los investigadores han intentado solucionar esto usando computadoras para "leer" el texto y adivinar cuáles son los confundidores. Pero esto es como intentar limpiar una ventana embarrada adivinando dónde está la suciedad; es difícil, lento y a menudo inexacto.

Este artículo presenta una nueva herramienta llamada GPI (Inferencia Impulsada por IA Generativa). Así es como funciona, usando una analogía simple:

La Fotocopiadora Mágica (La IA Generativa)

En lugar de solo leer historias existentes, los investigadores usan una "Fotocopiadora Mágica" (un Modelo de Lenguaje Grande, o LLM) para escribir las historias por ellos.

  1. El Prompt: El investigador le dice a la máquina: "Escribe una biografía de un político que tenga una trayectoria militar". Luego, le dice: "Escribe una biografía de un político que no tenga una trayectoria militar".
  2. El Plano Secreto: Aquí reside el superpoder. Cuando esta IA escribe la historia, no solo escupe palabras; crea un "plano" interno y oculto (una representación matemática) de exactamente lo que escribió.
  3. El Truco: Debido a que la IA escribió la historia, los investigadores tienen acceso a este plano perfecto y oculto. Saben exactamente qué puso la IA en el texto para que tratara sobre el ejército, y saben qué puso para todo lo demás (como la educación o el tono).

El "Desconfundidor" (El Filtro)

Los investigadores utilizan este plano perfecto para construir un filtro especial llamado Desconfundidor.

  • La Forma Antigua: Imagina que intentas separar canicas rojas y azules que están pegadas entre sí. Tienes que adivinar cómo separarlas.
  • La Forma GPI: Debido a que la IA escribió la historia, los investigadores tienen el "manual de instrucciones". Pueden mirar el plano y decir: "Bien, esta parte del plano es el ingrediente 'Militar', y esta otra parte es el ingrediente 'Educación'". Pueden aislar matemáticamente la parte militar sin alterar la parte de la educación.

Esto les permite preguntar: "Si mantenemos la educación y el tono exactamente iguales, pero solo cambiamos la parte militar, ¿cómo cambia la puntuación del votante?".

Por qué esto es mejor

El artículo afirma que este método es como actualizar de una calculadora de manivela a una supercomputadora por dos razones principales:

  1. Precisión: Debido a que utilizan el verdadero plano interno de la IA en lugar de adivinar el significado del texto, obtienen una respuesta mucho más clara. En sus pruebas, su método tuvo menos "ruido" (error) y dio resultados más fiables que los mejores métodos existentes.
  2. Velocidad: Los métodos antiguos son como intentar resolver un rompecabezas gigante mirando cada pieza una por una. El nuevo método es como tener la imagen en la caja; resuelve el problema aproximadamente 100 veces más rápido.

El Giro de la "Reutilización de Texto"

Los investigadores también descubrieron un atajo interesante. Si tomas una biografía existente y le pides a la IA que "reescriba esta misma historia exactamente", la IA crea un nuevo y perfecto plano para ese texto antiguo. Esto significa que ni siquiera necesitas generar nuevas historias desde cero; puedes usar datos viejos, pasarlos por la IA y obtener los mismos resultados de alta calidad.

La Conclusión

El artículo argumenta que al usar la IA Generativa no solo para generar texto, sino para comprender la estructura oculta de ese texto, finalmente podemos desenredar la compleja red de causa y efecto en las ciencias sociales.

  • El Objetivo: Medir el efecto real de una cosa específica (como el servicio militar) sobre un resultado (como la felicidad del votante).
  • El Problema: Otras cosas (confundidores) están mezcladas.
  • La Solución: Usar la IA para generar o reescribir el texto, tomar su "plano secreto" y usarlo para separar perfectamente la causa del ruido.

Los autores probaron esto con encuestas reales de votantes y descubrieron que, efectivamente, la trayectoria militar parece hacer que los votantes sientan más calidez hacia los candidatos, y pudieron demostrar esto con mucha más confianza y velocidad que antes. También señalan que esta misma lógica podría funcionar para imágenes y videos en el futuro, siempre que la IA pueda generarlos con una precisión similar.

¿Ahogado en artículos de tu campo?

Recibe resúmenes diarios de los artículos más novedosos que coincidan con tus palabras clave de investigación — con resúmenes técnicos, en tu idioma.

Probar Digest →