Perfect score on IPhO 2025 theory by Gemini agent

Este artigo relata que um agente simples baseado no modelo Gemini 3.1 Pro Preview obteve pontuação perfeita em todas as cinco execuções nos problemas teóricos da Olimpíada Internacional de Física (IPhO) de 2025, embora a possibilidade de contaminação de dados devido ao lançamento do modelo após a competição seja uma limitação importante.

Yichen Huang

Publicado 2026-03-05
📖 5 min de leitura🧠 Leitura aprofundada

Each language version is independently generated for its own context, not a direct translation.

Imagine que a Olimpíada Internacional de Física (IPhO) é como a Copa do Mundo da inteligência humana para estudantes do ensino médio. É o torneio mais difícil do mundo, onde os melhores jovens do planeta resolvem problemas de física que exigem raciocínio profundo, como se fossem quebra-cabeças de nível universitário.

Até agora, os computadores (Inteligência Artificial) conseguiam chegar perto da medalha de ouro, mas nunca ganhavam de verdade. Eles erravam detalhes ou não conseguiam explicar o "porquê" da resposta.

Este artigo conta a história de como um novo "robô superinteligente" chamado Gemini 3.1 Pro conseguiu, pela primeira vez, tirar nota máxima (100%) nessa competição, resolvendo todos os problemas teóricos de 2025 perfeitamente.

Aqui está a explicação do que aconteceu, usando analogias simples:

1. O "Atleta" e o Treinador

O autor do artigo, Yichen Huang, não apenas jogou o computador contra o problema. Ele criou um agente (um assistente digital). Pense nisso como um treinador de elite que organiza uma equipe de quatro atletas (o modelo de IA) para resolver cada parte do problema.

  • O Método de "Pensamento Paralelo": Em vez de pedir uma única resposta, o agente pede a quatro "versões" de si mesmo para resolver o mesmo problema ao mesmo tempo.
  • A "Reunião de Consenso": Depois que as quatro versões dão suas respostas, o agente as coloca em uma sala de reuniões. Ele diz: "Vejam, a versão A disse X, mas a versão B disse Y. Quem está certo? Vamos corrigir os erros e criar uma resposta final perfeita."
  • A Analogia: É como se você tivesse quatro consultores brilhantes. Se um deles erra um cálculo, os outros três percebem, apontam o erro e juntos eles escrevem o relatório final impecável.

2. O Problema das "Fotos" (Medições)

Alguns problemas de física vêm com gráficos e desenhos que precisam ser medidos (como medir a distância entre duas linhas em uma foto).

  • O Desafio: Olhar para uma foto e tentar medir com o olho é como tentar medir um quarto apenas olhando de longe; você pode errar por um pouco.
  • A Solução do Agente: O agente tem um "braço robótico" (código Python). Quando precisa medir algo num desenho, ele não "olha" apenas; ele escreve um pequeno programa que pega uma régua digital, mede os pixels com precisão cirúrgica e traz o número exato. É como trocar o olho humano por um scanner de alta tecnologia.

3. A Limpeza do "Livro de Regras" (Correção de Erros)

Uma parte muito interessante do artigo é que o autor não apenas testou a IA, mas também corrigiu o próprio exame.

  • O Detetive: O autor usou a IA para ler as perguntas e as respostas oficiais dos organizadores da Olimpíada.
  • O Achado: A IA descobriu que havia erros nas próprias perguntas e nas soluções oficiais!
    • Em um problema, o gráfico desenhado contradizia a física real (como um mapa que mostra uma montanha onde deveria haver um vale).
    • Em outro, uma fórmula na resposta oficial estava errada.
  • A Lição: Isso mostra que, quando a IA fica inteligente o suficiente, ela pode ajudar até os humanos a encontrar erros que passaram despercebidos por anos. O autor corrigiu esses erros antes de testar o agente, garantindo que a IA estivesse sendo julgada em um terreno justo.

4. O Grande "E se?" (O Risco de Trapaça)

Aqui entra a parte mais cautelosa do artigo. O exame da Olimpíada aconteceu em julho de 2025, mas o modelo de IA (Gemini 3.1) foi lançado em fevereiro de 2026.

  • O Dilema: Como a IA pode ter tirado nota máxima se ela foi lançada depois do exame?
  • A Suspeita: Existe o risco de "contaminação de dados". Imagine que a IA tenha "lido" as perguntas do exame em algum lugar da internet antes de ser lançada e memorizou as respostas, em vez de realmente aprender a resolver o problema.
  • A Defesa do Autor: O autor admite que esse risco existe. No entanto, ele argumenta que, mesmo com esse risco, o resultado é impressionante. O modelo anterior (Gemini 3 Deep Think) tirou cerca de 88%. O novo modelo, que é uma versão "turbinada" do anterior, tirou 100%. Isso sugere que a IA não apenas "decorou", mas realmente melhorou sua capacidade de raciocínio.

Resumo Final

Este artigo é como um anúncio de que a Inteligência Artificial deu um salto gigantesco.

  • O que eles fizeram: Criaram um sistema inteligente que usa múltiplas "opiniões" para corrigir erros e usa ferramentas de código para medir desenhos com precisão.
  • O resultado: A IA tirou nota máxima na prova de física mais difícil do mundo.
  • O aviso: Como a IA foi lançada depois da prova, não podemos ter 100% de certeza se ela "estudou o gabarito" ou se realmente aprendeu a física. Mas, seja qual for o motivo, isso mostra que estamos entrando em uma nova era onde as máquinas podem resolver problemas que antes eram exclusivos dos gênios humanos.

É como se um aluno tivesse passado no vestibular mais difícil do mundo com nota 10, mas a escola ainda estivesse discutindo se ele estudou muito ou se apenas teve acesso ao gabarito antes da prova. De qualquer forma, o desempenho é histórico.