Estimating Causal Effects of Text Interventions Leveraging LLMs

Este artigo apresenta o CausalDANN, uma abordagem inovadora que utiliza grandes modelos de linguagem (LLMs) para transformar textos e estimar efeitos causais em intervenções textuais complexas, superando as limitações dos métodos tradicionais ao lidar com dados observacionais e mudanças de domínio.

Siyi Guo, Myrl G. Marmarelis, Fred Morstatter, Kristina Lerman

Publicado 2026-03-17
📖 5 min de leitura🧠 Leitura aprofundada

Each language version is independently generated for its own context, not a direct translation.

Imagine que você é um detetive tentando descobrir a causa de algo no mundo real. Por exemplo: "Será que postar uma mensagem mais brava no Twitter faz as pessoas interagirem mais?" ou "Será que uma resenha positiva de um produto faz mais gente comprar?"

O problema é que, na vida real, não podemos fazer experimentos perfeitos. Não podemos pegar a mesma pessoa, fazer ela postar uma mensagem brava e outra calma ao mesmo tempo, e ver o que acontece. Temos que olhar para o que as pessoas já postaram (dados observacionais).

Mas aqui surge um grande obstáculo: como você isola a "raiva" de um texto? O texto é um pacote inteiro de informações. Se uma pessoa está brava, ela também pode estar usando gírias, escrevendo frases curtas ou falando de um assunto específico. Separar a "raiva" do resto é como tentar tirar o sal de uma sopa já pronta sem estragar o caldo.

É aqui que entra o CAUSALDANN, o "herói" deste artigo. Vamos explicar como ele funciona usando analogias simples:

1. O Problema: A Sopa da Raiva

Imagine que você quer saber se o tempero "pimenta" (a intervenção) faz a sopa ficar mais saborosa (o resultado).

  • O jeito antigo: Você tenta medir a pimenta em cada pote de sopa que já existe na prateleira. Mas a pimenta está misturada com o caldo, o sal e os legumes. É difícil saber se o sabor vem da pimenta ou se foi só porque a sopa tinha mais tomate.
  • O problema dos textos: Textos são como essas sopas complexas. A "raiva" ou o "sentimento positivo" está escondido dentro das palavras.

2. A Solução Mágica: O Chef Robô (LLM)

Os autores criaram uma ferramenta chamada CAUSALDANN. Pense nela como um Chef Robô superinteligente (um Modelo de Linguagem Grande, ou LLM) que tem um poder especial: ele pode recriar a sopa.

  • O Truque do Chef: Você pega uma receita original (o texto real) e pede ao Chef Robô: "Reescreva essa receita, mas coloque muita mais pimenta (raiva), mantendo todos os outros ingredientes (gramática, assunto, estilo) exatamente iguais."
  • O Chef Robô cria uma "versão paralela" do texto. Agora, você tem o texto original (sem tanta pimenta) e o texto transformado (com muita pimenta).

3. O Grande Desafio: A Sopa Invisível

Agora você tem dois textos: o original e o transformado.

  • Você sabe o resultado do texto original (ex: quantas pessoas curtiram).
  • Mas você não sabe o resultado do texto transformado, porque ele nunca foi postado de verdade! É como se o Chef Robô tivesse criado uma sopa em uma dimensão paralela.

Como descobrir o resultado da sopa da dimensão paralela? É aqui que entra a parte mais inteligente do sistema: A Adaptação de Domínio.

4. O Tradutor de Sotaques (DANN)

Imagine que você é um professor tentando ensinar um aluno.

  • O aluno (o modelo de IA) aprendeu a prever o sucesso de uma sopa usando receitas que ele já viu (os textos originais).
  • Agora, você quer que ele preveja o sucesso da nova receita (o texto transformado com mais pimenta).
  • O problema é que a nova receita tem um "sotaque" diferente (ela foi gerada por um robô, tem um tom diferente). Se o aluno tentar aplicar o que aprendeu na receita antiga diretamente, ele vai errar, porque o "sotaque" mudou. Isso é chamado de desvio de domínio.

O CAUSALDANN usa uma técnica chamada DANN (Rede Neural Adversarial de Domínio). Pense nisso como um treinador de esportes que ensina o aluno a ignorar o "sotaque" e focar apenas no sabor real.

  • O treinador diz: "Não importa se a sopa foi feita por um humano ou por um robô, ou se ela tem um sotaque diferente. O que importa é o ingrediente principal (a raiva). Aprenda a identificar o sabor da raiva, ignorando se a sopa veio de uma panela azul ou vermelha."
  • Isso faz com que o modelo seja muito mais preciso ao prever o que aconteceria com o texto transformado, mesmo que ele nunca tenha visto aquele texto específico antes.

5. O Resultado: A Verdade Desmascarada

Com o CAUSALDANN, o sistema consegue:

  1. Pegar um texto real.
  2. Usar o Chef Robô para criar uma versão "mais brava" ou "mais feliz".
  3. Usar o Treinador (DANN) para prever com precisão o que aconteceria com essa versão nova.
  4. Comparar o resultado real com o resultado previsto.

A conclusão?
O CAUSALDANN conseguiu prever o efeito causal (quanto a raiva aumenta o engajamento, por exemplo) com muito mais precisão do que os métodos antigos. Os métodos antigos tentavam adivinhar sem "recriar" o texto, e acabavam confundindo a raiva com outras coisas (como o assunto do post).

Resumo em uma frase

O CAUSALDANN é como um laboratório de realidade alternativa onde usamos Inteligência Artificial para reescrever mensagens, e depois usamos um "olho treinado" para prever o que aconteceria com essas novas mensagens, permitindo que descubramos a verdadeira causa e efeito nas conversas da internet, sem precisar fazer experimentos perigosos ou impossíveis no mundo real.

Por que isso é importante?
Isso ajuda a entender como nossas palavras afetam o mundo. Se soubermos exatamente como a raiva ou a positividade mudam o comportamento das pessoas, podemos criar melhores políticas, moderar redes sociais com mais sabedoria e entender melhor a psicologia humana.

Afogado em artigos na sua área?

Receba digests diários dos artigos mais recentes que correspondam às suas palavras-chave de pesquisa — com resumos técnicos, no seu idioma.

Experimentar Digest →