Causal Inference with Generative Artificial Intelligence: Application to Texts as Treatments

Este artigo propõe uma metodologia de Inferência Impulsionada por IA Generativa (GPI) que utiliza modelos de linguagem de grande escala para gerar tratamentos e utilizar suas representações internas para uma estimativa de efeito causal mais precisa e eficiente a partir de textos não estruturados, eliminando, assim, a necessidade de aprender representações causais diretamente dos dados e superando desafios comuns como confusão e violações de sobreposição.

Autores originais: Kosuke Imai, Kentaro Nakamura

Publicado 2026-06-12
📖 4 min de leitura☕ Leitura rápida

Autores originais: Kosuke Imai, Kentaro Nakamura

Artigo original sob licença CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). Esta é uma explicação gerada por IA do artigo abaixo. Não foi escrita nem endossada pelos autores. Para precisão técnica, consulte o artigo original. Ler aviso legal completo

Imagine que você é um detetive tentando descobrir se um detalhe específico em uma história muda o que as pessoas sentem sobre um personagem. Digamos que você queira saber: Ter um histórico militar faz os eleitores gostarem mais de um político?

O problema é que as histórias da vida real são bagunçadas. Um político com histórico militar também pode, por acaso, ser mais velho, ter um nível de escolaridade diferente ou escrever sua biografia com um tom mais emocional. Se você apenas comparar duas biografias aleatórias, não poderá dizer se os eleitores gostaram do candidato por causa da parte militar ou da parte da escolaridade. Na ciência, chamamos esses detalhes extras bagunçados de "confundidores" (confounders).

Tradicionalmente, pesquisadores tentam corrigir isso usando computadores para "ler" o texto e adivinhar quais são os confundidores. Mas isso é como tentar limpar uma janela suja de lama tentando adivinhar onde está a sujeira; é difícil, lento e muitas vezes impreciso.

Este artigo apresenta uma nova ferramenta chamada GPI (Inferência Alimentada por IA Generativa). Veja como ela funciona, usando uma analogia simples:

A Máquina de Cópias Mágica (A IA Generativa)

Em vez de apenas ler histórias existentes, os pesquisadores usam uma "Máquina de Cópias Mágica" (um Modelo de Linguagem Grande, ou LLM) para escrever as histórias para eles.

  1. O Comando (Prompt): O pesquisador diz à máquina: "Escreva uma biografia de um político que tenha um histórico militar". Depois, diz: "Escreva uma biografia de um político que não tenha um histórico militar".
  2. O Projeto Secreto: Aqui está o superpoder. Quando a IA escreve a história, ela não apenas cospe palavras; ela cria um "projeto" interno e oculto (uma representação matemática) de exatamente o que ela escreveu.
  3. O Truque: Como a IA escreveu a história, os pesquisadores têm acesso a esse projeto perfeito e oculto. Eles sabem exatamente o que a IA colocou no texto para torná-lo sobre o exército, e sabem o que ela colocou para todo o resto (como educação ou tom).

O "Desconfundidor" (O Filtro)

Os pesquisadores usam esse projeto perfeito para construir um filtro especial chamado Desconfundidor (Deconfounder).

  • Modo Antigo: Imagine tentar separar bolas de gude vermelhas e azuis que estão coladas. Você tem que adivinhar como separá-las.
  • Modo GPI: Como a IA escreveu a história, os pesquisadores têm o "manual de instruções". Eles podem olhar para o projeto e dizer: "Ok, esta parte do projeto é o ingrediente 'Militar', e esta outra parte é o ingrediente 'Educação'". Eles podem isolar matematicamente a parte militar sem bagunçar a parte da educação.

Isso permite que eles perguntem: "Se mantivermos a educação e o tom exatamente iguais, mas mudarmos apenas a parte militar, como a pontuação do eleitor muda?"

Por que isso é melhor

O artigo afirma que este método é como atualizar de uma calculadora de manivela para um supercomputador por duas razões principais:

  1. Precisão: Como eles usam o verdadeiro projeto interno da IA em vez de apenas adivinhar o significado do texto, eles obtêm uma resposta muito mais clara. Em seus testes, o método deles teve menos "ruído" (erro) e deu resultados mais confiáveis do que os melhores métodos existentes.
  2. Velocidade: Os métodos antigos são como tentar resolver um quebra-cabeça gigante olhando para cada peça uma por uma. O novo método é como ter a imagem na caixa; ele resolve o problema cerca de 100 vezes mais rápido.

A Reviravolta da "Reutilização de Texto"

Os pesquisadores também descobriram um atalho interessante. Se você pegar uma biografia existente e pedir para a IA "reescrever exatamente esta mesma história", a IA cria um novo projeto perfeito para aquele texto antigo. Isso significa que você nem precisa gerar novas histórias do zero; você pode usar dados antigos, alimentá-los com a IA e obter os mesmos resultados de alta qualidade.

A Conclusão

O artigo argumenta que, ao usar a IA Generativa não apenas para gerar texto, mas para entender a estrutura oculta desse texto, podemos finalmente desembaraçar a complexa teia de causa e efeito nas ciências sociais.

  • O Objetivo: Medir o efeito real de uma coisa específica (como o serviço militar) em um resultado (como a satisfação do eleitor).
  • O Problema: Outras coisas (confundidores) estão misturadas.
  • A Solução: Usar uma IA para gerar ou reescrever o texto, capturar seu "projeto secreto" e usar isso para separar perfeitamente a causa do ruído.

Os autores testaram isso em pesquisas reais com eleitores e descobriram que, sim, o histórico militar parece fazer os eleitores sentirem mais simpatia pelos candidatos, e eles conseguiram provar isso com muito mais confiança e velocidade do que antes. Eles também observam que essa mesma lógica poderia funcionar para imagens e vídeos no futuro, desde que a IA consiga gerá-los com precisão semelhante.

Afogado em artigos na sua área?

Receba digests diários dos artigos mais recentes que correspondam às suas palavras-chave de pesquisa — com resumos técnicos, no seu idioma.

Experimentar Digest →