Each language version is independently generated for its own context, not a direct translation.
🧠 O Grande Engano: "Não é Tão Bom Assim" na Programação por IA
Imagine que você contratou um super-herói da programação (uma Inteligência Artificial) para consertar um erro em um prédio gigante (um código de computador). Você espera que ele consiga olhar para todo o prédio de uma só vez, entender onde está o problema e consertá-lo instantaneamente.
O artigo que você leu é como um relatório de inspeção que diz: "Ei, esse super-herói não é tão poderoso quanto dizemos que ele é quando o prédio fica muito grande."
Aqui está a história, passo a passo:
1. A Promessa vs. A Realidade
Recentemente, as IAs ficaram muito "inteligentes" e conseguem ler quantidades enormes de texto (milhares de páginas de código de uma vez). A promessa era: "Agora, a IA pode ler o código inteiro de um projeto e resolver qualquer problema sozinha!"
Mas os autores deste estudo decidiram testar essa promessa de verdade. Eles usaram um "campo de treinamento" famoso chamado SWE-bench, que é basicamente um conjunto de problemas reais de programação do GitHub.
2. O Truque do "Passo a Passo" (O Agente)
Primeiro, eles testaram a IA deixando-a agir como um detetive.
- Como funciona: Em vez de dar todo o código de uma vez, o sistema diz à IA: "Vá até o arquivo X, leia isso, depois vá para o arquivo Y, leia aquilo, e depois tente consertar."
- O Resultado: A IA se saiu muito bem! Ela consertou cerca de 30% dos problemas.
- A Pegadinha: Ao analisar o que a IA fez, os pesquisadores descobriram que, na verdade, ela não estava lendo o prédio todo de uma vez. Ela estava lendo apenas um ou dois cômodos por vez (cerca de 20.000 a 30.000 "palavras" ou tokens).
- A Analogia: É como se você tivesse que montar um quebra-cabeça gigante. A IA não olha para a caixa inteira de 10.000 peças de uma vez. Ela pega 50 peças, monta um cantinho, depois pega mais 50, e assim por diante. Ela é boa em fazer isso, mas isso não significa que ela consegue processar 10.000 peças simultaneamente.
3. O Teste Real: "Aqui está o prédio todo, conserte!"
Para ver se a IA realmente consegue ler o código gigante de uma só vez, os pesquisadores fizeram um teste diferente:
- O Cenário: Eles pegaram todos os arquivos necessários para o conserto e jogaram tudo na mesa da IA de uma vez só (um contexto de 64.000 palavras). Sem etapas, sem ajuda, sem "detetive". Apenas: "Aqui está o problema, aqui está o código todo, faça o conserto agora."
- O Resultado: Foi um desastre.
- Uma das IAs mais avançadas (Qwen3) conseguiu consertar apenas 7% dos problemas.
- Outra IA famosa (GPT-5-nano) não conseguiu consertar nenhum (0%).
4. Por que ela falhou? (Os "Alucinações")
Quando a IA tentou consertar o código gigante de uma vez, ela começou a alucinar, como se estivesse sonhando acordada.
- O que aconteceu: Ela inventou linhas de código que não existiam, apontou para arquivos que não estavam na sala, ou escreveu instruções de conserto que faziam pouco sentido (como dizer "substitua a linha 500" quando o arquivo só tinha 100 linhas).
- A Analogia: Imagine um médico que tem que ler o prontuário completo de um paciente de 500 páginas de uma vez só. Em vez de focar, ele começa a inventar sintomas, prescrever remédios para doenças que o paciente não tem e confunde o nome do paciente com o do vizinho. O cérebro (ou a IA) fica sobrecarregado com tanta informação de uma vez.
5. A Conclusão Importante
O estudo chega a uma conclusão importante para o futuro da tecnologia:
- Tamanho não é documento: O fato de uma IA conseguir "ler" 1 milhão de palavras não significa que ela consegue "entender" e "raciocinar" sobre tudo isso ao mesmo tempo.
- O segredo é dividir: As IAs funcionam bem hoje porque são usadas em sistemas que dividem o trabalho em tarefas pequenas (como o detetive passo a passo).
- Precisamos de novos super-heróis: Se quisermos que as IAs resolvam problemas complexos olhando para o código inteiro de uma vez, precisamos criar modelos que sejam treinados especificamente para isso, e não apenas esperar que eles aprendam isso "de bônus" enquanto fazem tarefas pequenas.
Em resumo:
O artigo diz: "Não se iluda com o tamanho da memória da IA." Hoje, elas são ótimas em resolver problemas se você as guiar passo a passo, mas ainda são muito ruins em olhar para um problema gigante e resolver tudo de uma única vez. Elas precisam de um "mapa" e de "pistas", não apenas de uma pilha gigante de papéis na mesa.