Evidence from fMRI Supports a Two-Phase Abstraction Process in Language Models

Este estudo utiliza dados de fMRI e aprendizado de variedades para demonstrar que os modelos de linguagem exibem um processo de abstração em duas fases, onde a fase de composição se comprime em menos camadas com o treinamento e a capacidade de codificação neural está fortemente correlacionada com a dimensionalidade intrínseca das representações, derivando principalmente da composicionalidade do modelo e não de sua tarefa de previsão da próxima palavra.

Emily Cheng, Richard J. Antonello

Publicado 2026-03-16
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você está tentando entender como o cérebro humano funciona quando ouve uma história. Cientistas descobriram algo fascinante: os computadores modernos (chamados de Grandes Modelos de Linguagem, ou LLMs) "pensam" de uma maneira muito parecida com o nosso cérebro. Se você pegar o "pensamento" do computador em um determinado momento, consegue prever o que o cérebro de uma pessoa está fazendo naquele instante.

Mas aqui está o mistério: em qual momento o computador pensa mais parecido com o cérebro?

Surpreendentemente, não é no final, quando o computador está escolhendo a próxima palavra para dizer. É bem no meio do caminho, nas camadas intermediárias.

Este artigo, escrito por Emily Cheng e Richard Antonello, explica por que isso acontece, usando uma analogia de uma "fábrica de ideias" em duas fases.

A Analogia da Fábrica de Ideias

Imagine que o computador é uma fábrica gigante que transforma sons e palavras soltas em ideias complexas. Essa fábrica tem várias esteiras de produção (camadas).

  1. Fase 1: A Montagem (Abstração e Composição)

    • No começo da fábrica, as peças chegam soltas. O trabalho aqui é juntar essas peças, entender como elas se encaixam, criar estruturas e formar conceitos. É como montar um quebra-cabeça ou construir uma casa tijolo por tijolo.
    • Neste momento, a "complexidade" das ideias está crescendo. O computador está criando uma representação rica e detalhada do significado.
    • O que o artigo descobriu: É exatamente aqui, no auge dessa fase de montagem, que o computador mais se parece com o cérebro humano. Nosso cérebro também está ocupado montando o significado da frase, não apenas adivinhando a próxima palavra.
  2. Fase 2: A Embalagem (Previsão e Saída)

    • Depois que a ideia está montada, a fábrica precisa empacotá-la para vender. O trabalho muda: agora o foco é apenas prever qual é a próxima palavra que vai sair da fábrica.
    • Para fazer isso rápido e eficiente, a fábrica simplifica as coisas. Ela joga fora os detalhes complexos da "montagem" e foca apenas no resultado final.
    • O problema: Quando o computador entra nessa fase de "apenas prever a próxima palavra", ele deixa de se parecer com o cérebro. O cérebro humano continua processando o significado, mas o computador está focado apenas na estatística da próxima palavra.

O "Pico" da Complexidade

Os autores usaram uma espécie de "régua mágica" (chamada de dimensionalidade intrínseca) para medir o quão complexas e ricas são as ideias em cada etapa da fábrica.

  • Eles descobriram que existe um pico de complexidade.
  • Antes desse pico, a complexidade sobe (fase de montagem).
  • Depois desse pico, a complexidade cai (fase de previsão).
  • O segredo: O momento em que o computador mais se parece com o cérebro humano é exatamente no topo desse pico, onde a complexidade é máxima.

O Que Isso Significa para o Futuro?

  1. Não é só sobre "adivinhar a próxima palavra": Muitos pensavam que o computador parecia com o cérebro porque ambos tentam prever o futuro (a próxima palavra). O artigo diz: "Não exatamente". O cérebro se parece com o computador porque ambos estão construindo ideias complexas (composição), não apenas adivinhando.
  2. Melhorando os Computadores: Se quisermos criar computadores que entendam o mundo tão bem quanto nós, talvez não devamos focar apenas em fazê-los prever palavras. Devemos focar em melhorar a "Fase 1" (a montagem de ideias).
  3. Treinamento: À medida que os computadores são treinados por mais tempo, esse "pico de complexidade" (onde eles parecem com o cérebro) tende a se mover um pouco para trás, para as camadas iniciais. É como se a fábrica aprendesse a montar as ideias mais rápido.

Resumo em Uma Frase

O cérebro humano e os computadores inteligentes se parecem mais quando ambos estão construindo o significado de uma frase (a fase de montagem), e não quando estão apenas tentando adivinhar a próxima palavra (a fase de saída). O artigo prova que essa "fase de montagem" é o segredo da conexão entre máquinas e mentes humanas.

Receba artigos como este na sua caixa de entrada

Digests diários ou semanais personalizados de acordo com seus interesses. Gists ou resumos técnicos, no seu idioma.

Experimentar Digest →