Many AI Analysts, One Dataset: Navigating the Agentic Data Science Multiverse

Este artigo demonstra que analistas de IA autônomos podem replicar a diversidade analítica observada em estudos humanos, gerando resultados dispersos e "steeráveis" que evidenciam a necessidade de novas normas de transparência, como a divulgação de prompts e a adoção de relatórios estilo multiverso, para lidar com a incerteza analítica na ciência automatizada.

Martin Bertran, Riccardo Fogliato, Zhiwei Steven Wu

Publicado 2026-03-12
📖 5 min de leitura🧠 Leitura aprofundada

Each language version is independently generated for its own context, not a direct translation.

Imagine que você tem uma receita de bolo muito simples: "Faça um bolo de chocolate".

Agora, imagine que você contrata 5.000 chefs de cozinha, todos usando o mesmo conjunto de ingredientes (o mesmo banco de dados) e a mesma receita básica (a mesma hipótese). O que você acha que vai acontecer?

Você pode esperar que todos os bolos sejam iguais, certo? Não.

Alguns chefs vão usar cacau em pó, outros chocolate derretido. Alguns vão adicionar um pouco de café, outros um pouco de baunilha. Alguns vão assar a 180°C, outros a 200°C. O resultado? Você terá 5.000 bolos diferentes. Alguns ficarão deliciosos, outros secos, alguns podem até queimar. E, o mais importante: você pode escolher apenas o bolo que ficou mais bonito para mostrar aos seus convidados, ignorando os outros 4.999.

É exatamente isso que este artigo descobriu, mas no mundo da ciência e da Inteligência Artificial (IA).

O Grande Experimento: "Muitos Analistas, Um Dado"

Os autores do estudo (Martin Bertran, Riccardo Fogliato e Zhiwei Steven Wu) criaram um laboratório virtual. Eles não usaram humanos, mas sim agentes de IA (robôs inteligentes baseados em modelos de linguagem, como o Claude ou o Qwen) para atuar como cientistas.

Eles deram a esses robôs três desafios reais:

  1. Futebol: Os árbitros dão mais cartões vermelhos para jogadores de pele escura?
  2. Programação: A ajuda da IA faz os programadores trabalharem mais rápido?
  3. Política: Quem assiste mais TV tem opiniões políticas mais radicais?

Cada robô recebeu os mesmos dados e a mesma pergunta. Mas, como em nossa analogia dos chefs, cada um teve liberdade para tomar suas próprias decisões: como limpar os dados, qual fórmula matemática usar, quais variáveis incluir ou excluir.

O Que Eles Encontraram? (O "Multiverso" da Ciência)

O resultado foi chocante e fascinante:

  1. Tudo depende da escolha: Mesmo com os mesmos dados, os robôs chegaram a conclusões totalmente opostas. Para o mesmo problema de futebol, alguns robôs disseram "Sim, há racismo", outros disseram "Não, não há evidência" e alguns disseram "É complicado".
  2. O "Jardim de Caminhos" (Garden of Forking Paths): A ciência não é um caminho reto. É como um jardim com milhares de bifurcações. Em cada passo (escolher uma variável, decidir como tratar um dado faltante), o cientista (ou robô) vira para a esquerda ou para a direita. O artigo mostra que, dependendo de por onde você vira, você chega a um destino diferente.
  3. A Personalidade do Robô importa: Os autores deram "personalidades" diferentes aos robôs.
    • Um robô cético (que achava a hipótese falsa) tendia a encontrar menos evidências.
    • Um robô entusiasta (que queria provar a hipótese) encontrava mais.
    • Um robô "caçador de confirmação" (instruído a encontrar qualquer jeito de provar a hipótese) conseguiu manipular os dados de forma tão criativa que encontrou "evidências" onde talvez não existissem, usando truques estatísticos que parecem legais, mas são perigosos.

O Perigo: A Ilusão da Verdade Única

O problema principal que o artigo aponta é o seguinte: Agora que é barato e rápido gerar 5.000 análises, é muito fácil escolher apenas a que dá o resultado que você quer.

Imagine que um político quer provar que uma lei funciona. Ele pede para 100 robôs analisarem os dados. 99 dizem que a lei é inútil, mas 1 diz que é maravilhosa. Se ele publicar apenas aquele único relatório, o público acredita que a lei é ótima. Isso é chamado de viés de seleção ou "cherry-picking" (escolher apenas as cerejas boas).

Com a IA, isso pode acontecer em escala industrial. A ciência corre o risco de se tornar uma fábrica de "verdades" que são apenas reflexos do que o pesquisador queria ouvir.

A Solução: Mostrar Todos os Bolos

Mas, a mesma tecnologia que cria o problema também oferece a solução.

Como os robôs são rápidos e baratos, em vez de pedir um único relatório, devemos pedir todos os relatórios. O artigo propõe uma nova regra de transparência:

  • O "Multiverso" Visível: Quando um estudo for publicado, ele não deve mostrar apenas um número final. Deve mostrar um gráfico com todas as possibilidades (como uma "curva de especificação").
  • Transparência Total: Devemos divulgar não apenas o código e os dados, mas também os prompts (as instruções exatas) que foram dados à IA. Assim, todos podem ver: "Ah, esse resultado veio de um robô que foi instruído a ser otimista. Se eu usar um robô cético, o resultado muda."

Conclusão: O Que Isso Significa para Nós?

Este estudo é um alerta e uma oportunidade.

  • O Alerta: Não confie cegamente em um único estudo, especialmente se ele foi feito por IA ou se o autor parece muito entusiasmado com o resultado. A ciência não é sobre encontrar a resposta, mas entender quão incerta é a resposta.
  • A Oportunidade: Podemos usar a IA para mapear a incerteza. Em vez de esconder as escolhas que os cientistas fazem, podemos usá-las para ver o quão robusto é um fato. Se, ao mudar a "personalidade" do robô ou a fórmula, o resultado muda drasticamente, então aquele fato é frágil e não deve ser usado para tomar decisões importantes (como leis ou remédios).

Em resumo: A verdade científica não é um ponto único no mapa. É uma nuvem de possibilidades. E a IA nos ensina que, para ver a nuvem inteira, precisamos parar de olhar apenas para um ponto e começar a olhar para o céu todo.