Drift and selection in LLM text ecosystems

Este artigo desenvolve um modelo matemático exato para analisar como a interação entre deriva (reutilização não filtrada) e seleção (filtragem normativa) no ciclo de aprendizado recursivo de IA e dados públicos determina se o corpus textual converge para um estado superficial ou mantém estruturas mais profundas e ricas.

Søren Riis

Publicado 2026-04-13
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que a internet é uma biblioteca gigante onde todos os livros são escritos, lidos e reescritos por uma mistura de humanos e Inteligência Artificial (IA).

Este artigo, escrito por Søren Riis, investiga o que acontece quando essa biblioteca começa a se escrever sozinha. É como se os livros de hoje fossem usados para ensinar os escritores de amanhã, que por sua vez escrevem novos livros para ensinar os de depois, num ciclo infinito.

O autor usa uma metáfora simples para explicar dois "motores" que movem essa biblioteca: a Deriva (Drift) e a Seleção.

1. A Deriva: O Efeito "Cópia Imperfeita" (O que some)

Imagine que você tem uma caixa com 1.000 canetas de cores diferentes. A maioria é azul, mas há apenas uma caneta roxa rara.

  • O que acontece: Se você pedir para alguém tirar uma amostra aleatória de 100 canetas dessa caixa para fazer um novo lote, é muito provável que a caneta roxa não seja escolhida. Ela simplesmente "desaparece" por acaso.
  • Na biblioteca de IA: Quando as IAs leem textos e geram novos baseados no que viram, elas tendem a esquecer as palavras ou frases raras. Com o tempo, o texto público fica mais "genérico". As expressões criativas, o vocabulário estranho e as nuances complexas vão sumindo, como se a biblioteca estivesse sendo polida até ficar lisa e sem textura.
  • O resultado: O texto torna-se "raso". Ele é fácil de prever, mas perde a profundidade e a diversidade. É como se todos os livros começassem a soar iguais.

2. A Seleção: O "Filtro de Qualidade" (O que fica)

Agora, imagine que a biblioteca não aceita qualquer texto. Existe um editor (pode ser um humano ou um sistema de verificação) que decide o que entra na prateleira.

O autor divide esse editor em dois tipos:

A. O Editor "Descritivo" (O Espelho)

Este editor apenas copia o que está popular. Se o texto mais comum é "O gato está na mesa", ele publica isso.

  • O problema: Ele apenas reforça o que já existe. Se a IA começou a ficar "rasa" (como explicado na Deriva), esse editor apenas acelera o processo. O texto fica cada vez mais previsível e entediante. A biblioteca perde a capacidade de aprender coisas novas porque só olha para o espelho.

B. O Editor "Normativo" (O Juiz Exigente)

Este editor é diferente. Ele não se importa apenas com o que é comum; ele busca qualidade, correção ou novidade.

  • Exemplo: Imagine que a IA está tentando escrever um código de computador ou provar um teorema matemático. O editor só aceita o texto se o código funcionar ou a prova estiver correta.
  • O resultado: Mesmo que a IA cometa erros ou tente caminhos errados, o editor descarta o que falha e mantém o que funciona. Isso força a IA a manter uma estrutura mais profunda e complexa. A biblioteca continua rica e cheia de detalhes porque o "filtro" exige que o texto seja bom, não apenas comum.

A Grande Lição: O Que Aprendemos com Isso?

O artigo mostra que o futuro da nossa "biblioteca digital" depende de como filtramos o que publicamos.

  1. Se não filtrarmos (ou filtrarmos apenas pelo popular): A IA vai entrar num ciclo vicioso onde o texto fica cada vez mais simples, repetitivo e sem criatividade. É como se a cultura humana estivesse sendo "espremida" até sobrar apenas o óbvio.
  2. Se filtrarmos por qualidade (normativo): Podemos manter a riqueza do conhecimento. Mesmo que as IAs gerem textos, se houver um sistema que verifique a verdade, a lógica ou a criatividade antes de publicar, a biblioteca continuará profunda e útil para aprender coisas novas.

Analogia Final: A Cozinha da Biblioteca

Pense na biblioteca como uma cozinha onde se prepara uma sopa:

  • A Deriva é como tirar um pouco da sopa de hoje para fazer a de amanhã. Se você não tem cuidado, os ingredientes raros (ervas finas) vão sumindo, e a sopa fica cada vez mais parecida com água.
  • A Seleção Descritiva é servir a sopa exatamente como ela está, sem provar. Se a sopa ficou sem sal, a próxima também ficará.
  • A Seleção Normativa é ter um chef que prova a sopa. Se falta sal, ele adiciona. Se está sem gosto, ele melhora. Graças a esse chef, a sopa de amanhã continua saborosa e complexa, mesmo que a receita original tenha começado a se deteriorar.

Resumo: O texto de Søren Riis nos alerta que, para que a Inteligência Artificial continue sendo útil e criativa, não podemos apenas deixar ela "conversar com ela mesma". Precisamos de filtros humanos ou inteligentes que exijam qualidade, caso contrário, corremos o risco de criar um mundo de textos vazios e repetitivos.

Receba artigos como este na sua caixa de entrada

Digests diários ou semanais personalizados de acordo com seus interesses. Gists ou resumos técnicos, no seu idioma.

Experimentar Digest →