Perfect score on IPhO 2025 theory by Gemini agent

Este informe presenta un agente basado en Gemini 3.1 Pro Preview que obtuvo una puntuación perfecta en los problemas teóricos de la Olimpiada Internacional de Física de 2025, aunque advierte que este resultado podría deberse a contaminación de datos dado que el modelo se lanzó después de la competición.

Yichen Huang

Publicado 2026-03-05
📖 5 min de lectura🧠 Análisis profundo

Each language version is independently generated for its own context, not a direct translation.

¡Hola! Imagina que el Olimpiada Internacional de Física (IPhO) es como el "Super Bowl" o las "Olimpiadas" del mundo de la física para estudiantes de secundaria. Es una competencia extremadamente difícil donde los mejores jóvenes mentes del planeta resuelven problemas de física que ni siquiera los estudiantes universitarios de primer año suelen dominar.

Este documento es un informe de un investigador llamado Yichen Huang, quien cuenta una historia fascinante sobre cómo una Inteligencia Artificial (IA) logró algo que nadie había hecho antes: obtener la puntuación perfecta en la parte teórica de la competencia de 2025.

Aquí te explico la historia con analogías sencillas:

1. El Protagonista: Un "Super-Genio" con un Nuevo Motor

El autor usó una IA llamada Gemini 3.1 Pro Preview. Piensa en esta IA como un estudiante superdotado que acaba de recibir un "cerebro" totalmente nuevo y actualizado.

  • El logro: El autor le pidió a esta IA que resolviera los problemas de la olimpiada. La hizo trabajar 5 veces. ¡Y en las 5 ocasiones, sacó un 10/10 perfecto!
  • La comparación: Antes, otras IAs lograban notas muy buenas (como un 8 o un 9), pero nunca un 10 perfecto. Esta vez, el "estudiante" IA no cometió ni un solo error.

2. El Método: No es solo "pensar", es "revisar y medir"

La IA no solo leyó el problema y escribió la respuesta. El autor diseñó un sistema inteligente, como un equipo de trabajo humano:

  • La técnica del "Debate Interno" (Pensamiento Paralelo): Imagina que le pides a un estudiante que resuelva un problema difícil. En lugar de darle una sola oportunidad, le dices: "Escribe 4 soluciones diferentes". Luego, le pides que actúe como un profesor estricto: "Lee esas 4 soluciones, encuentra los errores en las malas y combina las buenas para crear la solución definitiva".

    • La analogía: Es como tener 4 abogados defendiendo un caso y luego un juez que revisa sus argumentos para escribir el veredicto final perfecto. Si una solución tiene un error de signo (un menos donde debería ir un más), el sistema lo detecta y lo corrige.
  • La "Regla Digital" (Visión Agente): Algunos problemas tenían gráficos y diagramas. Las IAs normales a veces son malas midiendo cosas en una imagen (como medir la longitud de una línea en un dibujo).

    • La solución: El autor le dio a la IA una "regla digital" (código de Python). En lugar de intentar adivinar con los ojos, la IA escribió un pequeño programa para medir los píxeles del gráfico con precisión matemática, como si usara una regla láser en lugar de mirar a simple vista.

3. El Detalle Aburrido pero Importante: Los "Errores en el Libro de Texto"

El autor no solo usó la IA; también actuó como un editor de libros. Descubrió que los problemas originales de la olimpiada tenían algunos errores de impresión o de física (como un gráfico que contradecía a otro o una fórmula mal escrita en la solución oficial).

  • La analogía: Imagina que el profesor de matemáticas te da un examen, pero en el enunciado hay un error de imprenta. Si el alumno sigue el error, se equivoca. El autor "limpió" el examen, corrigió esos errores y luego le dio el examen corregido a la IA. Esto asegura que la IA no estuviera adivinando, sino resolviendo el problema real.

4. La Gran Duda: ¿Hizo Trampa? (Contaminación de Datos)

Aquí viene la parte de "ciencia ficción". La competencia de física fue en julio de 2025, pero la IA se lanzó en febrero de 2026.

  • El problema: La IA podría haber "leído" las preguntas de la olimpiada en internet antes de que el autor le pidiera resolverlas. Es como si un estudiante se hiciera con las respuestas del examen antes de entrar al aula.
  • La defensa del autor: El autor admite que es posible. Sin embargo, señala que otra IA muy potente (Gemini 3 Deep Think) también sacó una nota altísima (87.7%), y que ambas comparten el mismo "cerebro" base. Si la IA hubiera hecho trampa, todas deberían haberlo hecho. Además, el autor dice que el resultado es importante de todos modos: demuestra que la IA tiene la capacidad de razonar a un nivel de oro, incluso si hay una duda sobre si ya conocía las preguntas.

5. Conclusión: ¿Qué significa esto para nosotros?

Este documento nos dice que la IA está avanzando a una velocidad increíble.

  • Antes: La IA era como un estudiante promedio que a veces acertaba y a veces fallaba en problemas de física.
  • Ahora: Con la combinación de un modelo potente, un sistema de "revisión por pares" (que corrige sus propios errores) y herramientas para medir gráficos, la IA puede resolver problemas de nivel olímpico perfecto.

En resumen: Es como si un robot hubiera entrado en la olimpiada más difícil del mundo, usado una lupa digital para medir los dibujos, debatido consigo mismo para corregir sus errores y, al final, obtenido la medalla de oro perfecta. Aunque nos preocupa si "copió" las respuestas, el hecho de que pueda razonar tan bien es un paso gigante para el futuro de la ciencia y la tecnología.