Infinite Problem Generator: Verifiably Scaling Physics Reasoning Data with Agentic Workflows

Este artículo presenta el Generador Infinito de Problemas (IPG), un marco de trabajo basado en agentes que utiliza el paradigma "Fórmula como Código" para sintetizar problemas de física con soluciones ejecutables y verificables, superando las limitaciones de los datos de entrenamiento actuales mediante la generación del corpus ClassicalMechanicsV1 y la identificación de una relación lineal entre la complejidad del código y la dificultad del problema.

Aditya Sharan, Sriram Hebbale, Dhruv Kumar

Publicado 2026-03-17
📖 4 min de lectura☕ Lectura para el café

Each language version is independently generated for its own context, not a direct translation.

Imagina que quieres enseñar a un robot (una Inteligencia Artificial) a resolver problemas de física, como los que se ven en los exámenes más difíciles de la universidad. El problema es que, para aprender bien, el robot necesita millones de ejercicios resueltos paso a paso. Pero conseguir esos ejercicios es como buscar agujas en un pajar: son escasos, y si intentas crearlos con un simple chatbot, este suele "alucinar" (inventar cosas que no tienen sentido) o cometer errores de cálculo.

Los autores de este paper, Aditya, Sriram y Dhruv, han creado una solución genial llamada IPG (Generador Infinito de Problemas). Aquí te explico cómo funciona usando analogías sencillas:

1. El Problema: El Chef que se inventa recetas

Normalmente, si le pides a una IA que cree un problema de física, actúa como un chef que nunca ha cocinado: intenta imitar el texto de una receta, pero a menudo olvida los ingredientes reales o mezcla cosas que no van juntas (como poner chocolate en una sopa de pescado). El resultado suena bien, pero si intentas cocinarlo (resolverlo), explota.

2. La Solución: El Arquitecto con Planos Digitales

El IPG no es un chef que improvisa; es un arquitecto riguroso. En lugar de escribir el problema como texto libre, utiliza una técnica llamada "Fórmula como Código".

  • La Analogía: Imagina que las leyes de la física (como la gravedad o la fricción) no son palabras en un libro, sino bloques de LEGO digitales que ya han sido probados y funcionan perfectamente.
  • Cómo funciona: El sistema toma un problema original hecho por un experto (una "semilla") y le dice a la IA: "Usa estos bloques de LEGO específicos para construir una nueva historia".
    • En lugar de decir "un coche va rápido", la IA construye el problema usando funciones de Python (código informático) que garantizan que la física es correcta.
    • Si la IA intenta poner un bloque que no encaja, el sistema lo detecta inmediatamente y lo tira a la basura antes de que se convierta en un problema.

3. El Proceso: La Fábrica de Problemas

El sistema funciona en tres pasos, como una línea de montaje:

  1. Análisis (El Detective): La IA lee el problema original y extrae las reglas del juego (qué fórmulas se usan, qué valores son posibles).
  2. Generación (El Artista Creativo): La IA cambia la historia. Si el problema original era sobre un tren, ahora puede ser sobre un cohete o un patinador, pero manteniendo la misma estructura matemática. Aquí es donde crea miles de variaciones.
  3. Verificación (El Inspector de Calidad): ¡Esta es la parte mágica! Antes de guardar el problema, el sistema ejecuta un programa de computadora para resolverlo automáticamente.
    • Si el código da un resultado imposible (como un tiempo negativo o una masa infinita), el problema se descarta.
    • Solo se guardan los problemas que la computadora puede resolver con éxito.

4. El Hallazgo Sorprendente: El "Plano de Complejidad"

Los investigadores descubrieron algo fascinante: la longitud del código de la solución es una medida perfecta de la dificultad del problema.

  • La Analogía: Imagina que quieres medir qué tan difícil es un rompecabezas. En lugar de adivinar, simplemente cuentas cuántas piezas tiene.
  • El descubrimiento: Encontraron que si un problema requiere 3 fórmulas de física, el código para resolverlo tendrá una longitud específica. Si requiere 6 fórmulas, el código será proporcionalmente más largo.
  • Por qué importa: Esto les permite crear "curriculums" (planes de estudio) automáticos. Pueden pedirle al sistema: "Dame 100 problemas fáciles (código corto)" y luego "Dame 100 problemas muy difíciles (código largo)", sin necesidad de que un humano los revise uno por uno.

5. El Resultado: Una Biblioteca Infinita

Con solo 165 problemas originales (las semillas), lograron generar 1,335 problemas nuevos de alta calidad, todos verificados por código.

  • Crearon un conjunto de datos llamado ClassicalMechanicsV1.
  • Estos problemas son tan buenos que sirven tanto para entrenar a la IA (para que aprenda a razonar) como para ponerla a prueba (para ver si realmente entiende la física y no solo está adivinando).

En Resumen

Este paper presenta una forma inteligente de crear infinitos ejercicios de física. En lugar de confiar en que la IA "sepa" física (lo cual a menudo falla), les dan a la IA una caja de herramientas de código pre-validado y la obligan a construir problemas que deben funcionar matemáticamente.

Es como pasar de pedirle a un niño que dibuje un puente (que podría caer) a darle un kit de construcción de ingeniería donde, si sigue las instrucciones, el puente siempre se sostiene. Esto permite crear datos de entrenamiento masivos, precisos y libres de errores para la próxima generación de IAs inteligentes.

Recibe artículos como este en tu bandeja de entrada

Resúmenes diarios o semanales personalizados según tus intereses. Gists o resúmenes técnicos, en tu idioma.

Probar Digest →