Evo: Autoregressive-Diffusion Large Language Models with Evolving Balance

O artigo apresenta o Evo, um modelo de linguagem de grande escala inovador que unifica as abordagens autoregressiva e de difusão em um único fluxo latente evolutivo, permitindo um equilíbrio adaptativo entre planejamento e refinamento para alcançar resultados de ponta em diversas tarefas com eficiência de inferência.

Junde Wu, Minhao Hu, Jiayuan Zhu, Yuyuan Liu, Tianyi Zhang, Kang Li, Jingkun Chen, Jiazhen Pan, Min Xu, Yueming Jin

Publicado 2026-03-10
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que escrever um texto é como construir uma casa.

Até hoje, os modelos de inteligência artificial (como o GPT) funcionavam como um alvenarista muito rápido, mas um pouco apressado. Eles colocam um tijolo de cada vez, da esquerda para a direita. Se eles erram o primeiro tijolo, o resto da parede pode ficar torta, e eles não têm muita paciência para voltar e consertar o que já foi feito. Isso é chamado de modelo Autoregressivo (AR). É rápido, mas pode cometer erros que se acumulam.

Por outro lado, existem modelos baseados em Difusão (inspirados na geração de imagens). Eles funcionam como um escultor. Eles começam com um bloco de pedra bruta (ruído) e vão lixando e moldando até que a estátua apareça. Isso permite um planejamento global incrível e correções de erros, mas é muito lento, porque o escultor precisa lixar a pedra inteira várias vezes antes de terminar.

O papel que você enviou apresenta o Evo, um novo modelo que tenta ter o melhor dos dois mundos.

A Analogia do "Arquiteto-Carpinteiro"

O Evo não é apenas um alvenarista nem apenas um escultor. Ele é um Arquiteto-Carpinteiro inteligente que usa um "tempo de maturação" para cada palavra.

  1. O Conceito de "Tempo de Maturação" (tit_i):
    Imagine que cada palavra que o modelo vai escrever tem um "nível de confiança" ou "maturidade".

    • Palavras Fáceis (Baixo tit_i): Para palavras óbvias (como "o" ou "e"), o modelo age como o alvenarista rápido. Ele escreve a palavra de uma vez só, sem pensar muito. É rápido e eficiente.
    • Palavras Difíceis (Alto tit_i): Para palavras complexas (como uma solução de um problema de matemática ou um código de programação), o modelo muda para o modo escultor. Ele "pensa" mais, refina a ideia, faz várias passadas mentais para garantir que está certo antes de "escrever" a palavra final.
  2. A "Trilha Secreta" (Trajetória Latente):
    O Evo não vê a escrita como uma linha reta. Ele vê como um caminho contínuo.

    • No início do caminho, ele está "planejando" (como um borrão de ideias).
    • No final do caminho, ele está "realizando" (a palavra clara).
    • O grande truque do Evo é que ele decide individualmente para cada palavra onde ela está nesse caminho. Algumas palavras chegam ao fim rápido; outras demoram mais para "amadurecer".

Por que isso é revolucionário?

  • Velocidade vs. Qualidade: Modelos antigos de "Difusão" eram lentos porque lixavam tudo. Modelos "Autoregressivos" eram rápidos, mas erravam em tarefas difíceis. O Evo é rápido porque só "lixa" (refina) o que realmente precisa. Se a frase é simples, ele voa. Se é complexa, ele foca.
  • Raciocínio: Em testes de matemática e lógica (como GSM8K) e programação (HumanEval), o Evo bateu recordes. Isso acontece porque ele consegue "planejar" a estrutura da frase inteira antes de se comprometer com os detalhes, algo que os modelos antigos faziam mal.
  • Unificação Teórica: Os autores provaram matematicamente que "escrever palavra por palavra" e "moldar a partir do ruído" são, na verdade, a mesma coisa vista de ângulos diferentes. O Evo é a ponte que une essas duas visões.

Resumo em uma frase

O Evo é como um escritor que sabe exatamente quando deve escrever rápido e quando deve parar para pensar profundamente, ajustando sua velocidade e esforço para cada palavra individualmente, resultando em textos mais inteligentes e criados na velocidade do pensamento.

Em resumo: O Evo não força o modelo a ser lento ou rápido o tempo todo. Ele é adaptativo, tornando-se um "alvenarista" quando a tarefa é fácil e um "escultor" quando a tarefa exige precisão, tudo isso em um único cérebro digital.