Jian Yang, Wei Zhang, Shawn Guo, Zhengmao Ye, Lin Jing, Shark Liu, Yizhi Li, Jiajun Wu, Cening Liu, X. Ma, Yuyang Song, Siwei Wu, Yuwen Li, L. Liao, T. Zheng, Ziling Huang, Zelong Huang, Che Liu, Yan

Publicado 2026-03-18

📖 5 min de leitura🧠 Leitura aprofundada

Each language version is independently generated for its own context, not a direct translation.

O IQuest-Coder-V1: O "Estagiário de Programação" que Aprendeu a Pensar

Imagine que você quer ensinar um robô a ser um programador de elite. A maioria dos robôs de hoje é como um estudante que decorou todos os livros de programação, mas nunca viu um projeto real sendo construído. Eles sabem a teoria, mas travam quando precisam consertar um erro complexo ou planejar uma mudança em um sistema gigante.

O IQuest-Coder-V1 é diferente. A equipe do IQuest criou uma nova família de "cérebros" de IA (com tamanhos de 7B a 40B bilhões de parâmetros) que não apenas memoriza código, mas aprende a evoluir com ele.

Aqui está como eles fizeram isso, usando analogias do dia a dia:

1. A Metodologia: O "Fluxo de Código" (Code-Flow)

Em vez de apenas ler um livro de receitas (código estático), o IQuest-Coder foi treinado assistindo a um filme de como a receita foi criada.

O Treinamento Clássico: É como dar ao aluno apenas a versão final de um livro de receitas. Ele sabe o que está escrito, mas não sabe por que o chef trocou o sal por açúcar no meio do processo.
O Método IQuest (Code-Flow): Eles treinaram a IA observando o histórico de mudanças de projetos reais. Eles viram o código "antes", a "correção" (o patch) e o "depois".
- Analogia: É como se você ensinasse um detetive não apenas a olhar a cena do crime, mas a assistir a todo o vídeo de como o crime aconteceu, passo a passo. Isso ensina a IA a planejar e a entender a lógica por trás das mudanças, não apenas a copiar o resultado.

2. A Jornada de Aprendizado (O Pipeline Evolutivo)

A IA passou por três fases de "escola", cada uma mais difícil que a anterior:

Fase 1: A Base (Pré-treinamento): A IA leu milhões de linhas de código, documentação e fatos técnicos. Foi como a alfabetização e o ensino fundamental.
Fase 2: O "Meio-Treinamento" (Mid-Training): Aqui é onde a mágica acontece. A IA foi colocada em cenários complexos:
- Raciocínio: Resolver problemas de lógica e matemática.
- Agente: Aprender a usar ferramentas (como um terminal de computador), cometer erros, ver o erro, e tentar de novo.
- Contexto Gigante: Ela aprendeu a ler e entender projetos inteiros (até 128 mil linhas de uma vez), como um arquiteto que consegue visualizar um prédio inteiro em sua mente, e não apenas um tijolo.
Fase 3: A Especialização (Pós-treinamento): A IA foi dividida em dois tipos de "profissionais":
- O "Pensador" (Thinking Path): Este modelo é treinado para pensar antes de agir. Ele usa um processo de "tentativa e erro" interno (Reforço por Aprendizado) para se corrigir. É como um programador sênior que faz um rascunho mental, verifica se está certo, e só então escreve o código final. Ele é ótimo em tarefas difíceis e longas.
- O "Instrutor" (Instruct Path): Este modelo é treinado para ser um assistente rápido e prestativo. Ele responde a comandos diretos, gera código rápido e ajuda no dia a dia. É como um estagiário ágil que faz o que você pede imediatamente.

3. A Inovação: O Modelo "Loop" (O Ciclo)

Um dos maiores desafios é que modelos muito inteligentes são pesados e lentos. O IQuest criou uma versão chamada "Loop".

Analogia: Imagine que você tem um funcionário muito inteligente, mas ele é caro e lento. O modelo "Loop" é como dar a esse funcionário um relógio de bolso. Ele pode olhar para o mesmo problema duas vezes, refinando sua resposta na segunda passada, sem precisar de um computador gigante extra. Isso permite que ele seja tão inteligente quanto os modelos gigantes, mas mais leve e eficiente para rodar em computadores comuns.

4. Os Resultados: O Que Eles Conseguem Fazer?

O papel mostra que o IQuest-Coder-V1 está competindo de igual para igual (e às vezes superando) os maiores modelos fechados do mundo (como o GPT-5.1 e o Claude Sonnet 4.5) em testes reais:

Engenharia de Software Autônoma: Eles conseguem pegar um projeto com erros, entender o problema, criar um "remendo" (patch) e fazer o projeto funcionar de novo, quase como um humano faria.
Programação Competitiva: Resolvem problemas de lógica complexa em concursos de programação.
Uso de Ferramentas: Conseguem navegar em terminais de computador, usar bancos de dados e interagir com a web para completar tarefas.

Resumo Final

O IQuest-Coder-V1 é como ter um estagiário de programação que cresceu assistindo a engenheiros experientes resolverem problemas reais ao longo do tempo, em vez de apenas ler manuais.

Ele tem duas personalidades:

O Estrategista: Que pensa profundamente, erra, corrige e resolve problemas impossíveis.
O Executor: Que é rápido, útil e faz o trabalho braçal do dia a dia.

E o melhor de tudo? Eles liberaram todo o "manual de instruções" e os modelos para que qualquer pessoa possa estudar como essa inteligência foi construída, acelerando o futuro da programação feita por máquinas.

IQuest-Coder-V1 Technical Report

O IQuest-Coder-V1: O "Estagiário de Programação" que Aprendeu a Pensar

1. A Metodologia: O "Fluxo de Código" (Code-Flow)

2. A Jornada de Aprendizado (O Pipeline Evolutivo)

3. A Inovação: O Modelo "Loop" (O Ciclo)

4. Os Resultados: O Que Eles Conseguem Fazer?

Resumo Final

Resumo Técnico: IQuest-Coder-V1

1. O Problema

2. Metodologia: O Paradigma "Code-Flow"

A. Pré-treinamento e Recozimento (Annealing) de Alta Qualidade

B. Mid-Training (Treinamento Intermediário)

C. Pós-treinamento Bifurcado

D. Arquitetura LoopCoder (IQuest-Coder-V1-Loop)

3. Contribuições Chave

4. Resultados e Desempenho

5. Significado e Impacto

IQuest-Coder-V1 Technical Report

O IQuest-Coder-V1: O "Estagiário de Programação" que Aprendeu a Pensar

1. A Metodologia: O "Fluxo de Código" (Code-Flow)

2. A Jornada de Aprendizado (O Pipeline Evolutivo)

3. A Inovação: O Modelo "Loop" (O Ciclo)

4. Os Resultados: O Que Eles Conseguem Fazer?

Resumo Final

Resumo Técnico: IQuest-Coder-V1

1. O Problema

2. Metodologia: O Paradigma "Code-Flow"

A. Pré-treinamento e Recozimento (Annealing) de Alta Qualidade

B. Mid-Training (Treinamento Intermediário)

C. Pós-treinamento Bifurcado

D. Arquitetura LoopCoder (IQuest-Coder-V1-Loop)

3. Contribuições Chave

4. Resultados e Desempenho

5. Significado e Impacto

Mais como este

Exploration and Exploitation Errors Are Measurable for Language Model Agents

SciFi: A Safe, Lightweight, User-Friendly, and Fully Autonomous Agentic AI Workflow for Scientific Applications

Numerical Instability and Chaos: Quantifying the Unpredictability of Large Language Models

Optimizing Earth Observation Satellite Schedules under Unknown Operational Constraints: An Active Constraint Acquisition Approach

WebXSkill: Skill Learning for Autonomous Web Agents