Towards Cold-Start Drafting and Continual Refining: A Value-Driven Memory Approach with Application to NPU Kernel Synthesis

O artigo apresenta o EvoKernel, um framework de agentes autoevolutivos que utiliza uma abordagem de memória orientada a valor para superar a escassez de dados na síntese de kernels para NPUs, melhorando drasticamente a precisão e o desempenho através de rascunhos iniciais e refinamento contínuo sem necessidade de ajuste fino custoso.

Yujie Zheng, Zhuo Li, Shengtao Zhang, Hanjing Wang, Junjie Sheng, Jiaqian Wang, Junchi Yan, Weinan Zhang, Ying Wen, Bo Tang, Muning Wen

Publicado 2026-03-12
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você é um mestre cozinheiro (um Modelo de Inteligência Artificial) famoso por fazer pratos incríveis na cozinha da sua cidade natal (o mundo CUDA, onde há milhões de receitas e ingredientes). Você é um gênio culinário.

Agora, imagine que você é enviado para uma ilha remota e desconhecida (o mundo NPU, uma arquitetura de hardware específica e nova). O problema? Na ilha, não há livros de receitas, não há ingredientes comuns e ninguém sabe cozinhar como você. Se você tentar cozinhar usando apenas o que sabe da sua cidade natal, vai falhar miseravelmente. Isso é o que os cientistas chamam de "Cold Start" (Início Frio): tentar fazer algo complexo sem dados ou exemplos prévios.

O papel que você leu apresenta uma solução genial chamada EvoKernel. Vamos entender como ele funciona com uma analogia simples:

1. O Problema: O "Muro de Dados"

Na ilha (NPU), os melhores chefs do mundo (os modelos de IA mais avançados) tentam cozinhar, mas falham. Eles tentam 100 vezes e só acertam 11 pratos. O resto queima ou fica sem sal.

  • Por que? Porque eles estão tentando memorizar receitas antigas que não funcionam na nova cozinha.
  • O erro comum: Tentar reescrever todo o cérebro do chef (ajustar o modelo) para aprender a nova cozinha. Isso é caro, demorado e difícil de conseguir os ingredientes (dados) necessários.

2. A Solução: O "Caderno de Anotações Mágico" (EvoKernel)

Em vez de mudar o cérebro do chef, os autores criaram um sistema de memória inteligente chamado EvoKernel. Pense nele como um caderno de anotações vivo que o chef carrega consigo.

O processo funciona em duas fases principais, como se fosse uma jornada de aprendizado:

Fase 1: O Rascunho (Drafting) – "Tentar e Errar"

O chef pega um ingrediente novo e tenta fazer o prato.

  • Ele olha no caderno: "Já tentei algo parecido antes? O que funcionou?"
  • Ele escreve uma receita (o código).
  • Ele testa na cozinha. Se queimar, o caderno registra: "Isso não funcionou, não use isso de novo."
  • Se o prato ficar pronto (mesmo que feio), o caderno registra: "Isso funcionou! Guarde isso como base."
  • O Segredo: O caderno não guarda apenas o que foi tentado, ele aprende o que vale a pena tentar. Ele usa uma "bússola de valor" (Value-Driven) para decidir qual receita antiga ajuda mais agora.

Fase 2: O Refinamento (Refining) – "Tornar o prato perfeito"

Agora que o prato está pronto e comestível, o chef quer que ele seja mais rápido e mais saboroso.

  • Ele olha no caderno: "Qual foi a melhor maneira de cortar esse legume que encontrei antes?"
  • Ele tenta pequenas mudanças para acelerar o cozimento.
  • A cada tentativa, o caderno atualiza sua "bússola": "Ah, essa técnica de corte reduziu o tempo em 30%? Anotei isso como algo valioso!"
  • Com o tempo, o prato que levava 10 minutos passa a levar 3 minutos.

3. A Grande Magia: O Caderno que Aprende Sozinho

O que torna o EvoKernel especial é que ele não precisa de um professor humano ensinando o chef a cada passo.

  • Memória Compartilhada: Se o chef aprendeu a cortar uma cenoura rápido em um prato, ele usa esse conhecimento para cortar um tomate em outro prato. O caderno conecta experiências diferentes.
  • Aprendizado de Valor: O sistema não guarda tudo. Ele aprende a filtrar o que é "lixo" e o que é "ouro". Ele sabe que, no início, o importante é apenas fazer o prato sair (corretude). Depois, o importante é fazer rápido (velocidade). O caderno muda de foco sozinho.

Os Resultados (A Prova de Que Funciona)

Os cientistas testaram isso em uma bancada de testes chamada KernelBench (adaptada para a ilha NPU).

  • Antes: Os melhores chefs (modelos de IA) acertavam apenas 11% dos pratos.
  • Com EvoKernel: Eles acertaram 83% dos pratos!
  • Velocidade: Além de acertar, os pratos ficaram, em média, 3,6 vezes mais rápidos do que a primeira tentativa.

Resumo em uma Frase

O EvoKernel é como dar a um chef novato em uma cozinha desconhecida um caderno de anotações inteligente que aprende sozinho com cada erro e acerto, compartilhando lições entre diferentes pratos, permitindo que ele se torne um mestre mesmo sem ter um livro de receitas prévio.

Isso é revolucionário porque permite que a Inteligência Artificial domine hardwares novos e específicos (como chips de IA chineses ou especializados) sem precisar de milhões de dados de treinamento, apenas com "pouca memória" e muita persistência.