Let It Flow: Agentic Crafting on Rock and Roll, Building the ROME Model within an Open Agentic Learning Ecosystem

Weixun Wang, XiaoXiao Xu, Wanhe An, Fangwen Dai, Wei Gao, Yancheng He, Ju Huang, Qiang Ji, Hanqi Jin, Xiaoyang Li, Yang Li, Zhongwen Li, Shirong Lin, Jiashun Liu, Zenan Liu, Tao Luo, Dilxat Muhtar, Yuanbin Qu, Jiaqiang Shi, Qinghui Sun, Yingshui Tan, Hao Tang, Runze Wang, Yi Wang, Zhaoguo Wang, Yanan Wu, Shaopan Xiong, Binchen Xu, Xander Xu, Yuchi Xu, Qipeng Zhang, Xixia Zhang, Haizhou Zhao, Jie Zhao, Shuaibing Zhao, Baihui Zheng, Jianhui Zheng, Suhang Zheng, Yanni Zhu, Mengze Cai, Kerui Cao, Xitong Chen, Yue Dai, Lifan Du, Tao Feng, Tao He, Jin Hu, Yijie Hu, Ziyu Jiang, Cheng Li, Xiang Li, Jing Liang, Xin Lin, Chonghuan Liu, ZhenDong Liu, Zhiqiang Lv, Haodong Mi, Yanhu Mo, Junjia Ni, Shixin Pei, Jingyu Shen, XiaoShuai Song, Cecilia Wang, Chaofan Wang, Kangyu Wang, Pei Wang, Tao Wang, Wei Wang, Ke Xiao, Mingyu Xu, Tiange Xu, Nan Ya, Siran Yang, Jianan Ye, Yaxing Zang, Duo Zhang, Junbo Zhang, Boren Zheng, Wanxi Deng, Ling Pan, Lin Qu, Wenbo Su, Jiamang Wang, Wei Wang, Hu Wei, Minggang Wu, Cheng Yu, Bing Zhao, Zhicheng Zheng, Bo Zheng

Publicado 2026-03-13

📖 5 min de leitura🧠 Leitura aprofundada

Ver no arXiv ↗PDF ↗

Each language version is independently generated for its own context, not a direct translation.

Imagine que você quer ensinar um robô não apenas a responder perguntas, mas a trabalhar de verdade. Você quer que ele consiga entrar em um computador, abrir programas, escrever código, testar se funciona, corrigir erros e entregar um projeto pronto. Isso é o que chamamos de "Agentic Crafting" (Artesanato de Agentes).

O problema é que, até agora, a maioria das IAs era como um aluno que só sabe fazer a lição de casa se o professor der a resposta certa na hora. Se o aluno errar, ele trava. Para criar um robô que realmente trabalha, precisamos de uma escola inteira, não apenas uma sala de aula.

Este artigo apresenta ROME (um novo modelo de IA) e o ALE (o sistema escolar completo que o criou). Vamos usar analogias simples para entender como tudo funciona:

1. O Problema: O Aluno que Trava

Antes, as IAs eram como fotógrafos de uma única foto. Você dá um comando ("escreva um código"), elas tiram a foto e pronto. Se o código tiver um erro, elas não sabem consertar sozinhas. Elas não têm "memória" do que aconteceu antes nem coragem de tentar de novo.

2. A Solução: A Escola Completa (ALE)

Os autores criaram um ecossistema chamado ALE (Agentic Learning Ecosystem). Pense nele como uma escola de formação de agentes com três departamentos principais:

ROCK (O Campo de Treino Seguro): Imagine um laboratório de ciências super seguro, onde você pode fazer explosões, quebrar coisas e testar foguetes sem queimar a escola. O ROCK é esse laboratório digital. Ele cria "caixas de areia" (sandboxes) onde a IA pode tentar escrever código, instalar programas e até cometer erros graves sem estragar o computador real. É aqui que a IA aprende na prática.
ROLL (O Treinador de Elite): É o sistema que organiza os treinos. Em vez de o aluno fazer um exercício de cada vez, o ROLL permite que milhares de robôs treinem ao mesmo tempo, em diferentes cenários. Ele é como um treinador que observa todos os alunos, anota quem acertou, quem errou e ajusta a dificuldade do treino para que todos evoluam rápido.
iFlow CLI (O Gerente de Projetos): É o "braço direito" da IA. Enquanto a IA pensa, o iFlow organiza as ferramentas, lembra o que foi feito antes e garante que a IA não se perca no meio do caminho. É como um assistente pessoal que segura a mão do robô, garantindo que ele use as ferramentas certas na ordem certa.

3. O Aluno: ROME

ROME é o robô que nasceu dessa escola. Ele não é apenas um modelo de linguagem; ele é um agente.

O que ele faz diferente? Em vez de apenas "adivinhar" a próxima palavra, ele planeja. Ele pensa: "Preciso abrir o terminal, rodar esse comando, ver o erro, mudar o código e rodar de novo".
O segredo do treino (IPA): O artigo introduz uma técnica genial chamada IPA. Imagine que você está aprendendo a andar de bicicleta. Se você cair no primeiro segundo, não adianta punir todo o seu corpo. O IPA ensina a IA a focar nos momentos decisivos (os "chunks"). Se a IA escolheu a ferramenta errada no início, o sistema aprende com esse erro específico, em vez de punir toda a conversa. Isso torna o aprendizado muito mais estável e rápido.

4. O Resultado: O Pequeno Gigante

O mais impressionante é o tamanho. O ROME é um modelo "pequeno" (comparado aos monstros de 100 bilhões de parâmetros que as grandes empresas usam).

A Analogia: É como se um atleta de 1,70m, treinado com essa metodologia perfeita, conseguisse derrotar jogadores de basquete de 2,10m que treinam de qualquer jeito.
Os Números: Em testes reais de programação e resolução de problemas complexos, o ROME superou modelos muito maiores e rivais com modelos proprietários (fechados e caros). Ele conseguiu resolver problemas difíceis de terminal e correção de bugs com uma eficiência surpreendente.

5. O Novo Desafio: O "Terminal Bench Pro"

Os autores perceberam que os testes antigos eram fáceis demais (como um teste de matemática com apenas 5 questões). Então, eles criaram o Terminal Bench Pro.

A Analogia: É como trocar um teste de 5 questões por uma maratona de 400 provas, cobrindo desde consertar um computador até criar jogos, com regras muito mais rígidas para garantir que a IA não esteja apenas "chutando" ou copiando respostas. Mesmo nesse teste super difícil, o ROME se saiu muito bem, mostrando que ele realmente aprendeu a trabalhar, e não apenas a decorar.

Resumo Final

Este artigo diz: "Para criar IAs que realmente trabalham no mundo real, precisamos parar de apenas dar mais dados para elas e começar a construir sistemas de treino completos (com laboratórios seguros, treinadores inteligentes e gerentes de projeto). Com isso, conseguimos criar um robô pequeno, mas extremamente capaz, que pode fazer o trabalho de robôs gigantes."

É como se eles tivessem descoberto a fórmula secreta para transformar um estudante mediano em um mestre artesão, sem precisar de um milhão de anos de estudo, mas sim com o método de ensino certo.

Let It Flow: Agentic Crafting on Rock and Roll, Building the ROME Model within an Open Agentic Learning Ecosystem

1. O Problema: O Aluno que Trava

2. A Solução: A Escola Completa (ALE)

3. O Aluno: ROME

4. O Resultado: O Pequeno Gigante

5. O Novo Desafio: O "Terminal Bench Pro"

Resumo Final

Título: Let It Flow: Agentic Crafting on Rock and Roll

1. O Problema

2. Metodologia: O Ecossistema de Aprendizado Agente (ALE)

A. Infraestrutura do Sistema (ALE)

B. Composição de Dados

C. Pipeline de Treinamento e Algoritmo IPA

3. Resultados Principais

Desempenho em Benchmarks

Novo Benchmark: Terminal Bench Pro

Estudos de Caso no Mundo Real

4. Contribuições Chave

5. Significado e Impacto

Let It Flow: Agentic Crafting on Rock and Roll, Building the ROME Model within an Open Agentic Learning Ecosystem

1. O Problema: O Aluno que Trava

2. A Solução: A Escola Completa (ALE)

3. O Aluno: ROME

4. O Resultado: O Pequeno Gigante

5. O Novo Desafio: O "Terminal Bench Pro"

Resumo Final

Título: Let It Flow: Agentic Crafting on Rock and Roll

1. O Problema

2. Metodologia: O Ecossistema de Aprendizado Agente (ALE)

A. Infraestrutura do Sistema (ALE)

B. Composição de Dados

C. Pipeline de Treinamento e Algoritmo IPA

3. Resultados Principais

Desempenho em Benchmarks

Novo Benchmark: Terminal Bench Pro

Estudos de Caso no Mundo Real

4. Contribuições Chave

5. Significado e Impacto

Mais como este

Diffusion Language Models Know the Answer Before Decoding

Contextual Earnings-22: A Speech Recognition Benchmark with Custom Vocabulary in the Wild

Hybrid CNN-Transformer Architecture for Arabic Speech Emotion Recognition

Cross-Tokenizer LLM Distillation through a Byte-Level Interface

Lexical Tone is Hard to Quantize: Probing Discrete Speech Units in Mandarin and Yorùbá