Infinite Problem Generator: Verifiably Scaling Physics Reasoning Data with Agentic Workflows

Il paper presenta l'Infinite Problem Generator (IPG), un framework agentic che supera la scarsità di dati di ragionamento verificabili in fisica generando problemi di meccanica classica risolvibili tramite codice eseguibile, garantendo coerenza matematica e permettendo una generazione controllata della difficoltà attraverso una correlazione lineare tra complessità del codice e difficoltà del problema.

Aditya Sharan, Sriram Hebbale, Dhruv Kumar

Pubblicato 2026-03-17
📖 4 min di lettura☕ Lettura da pausa caffè

Each language version is independently generated for its own context, not a direct translation.

Immagina di voler insegnare a un robot (un'intelligenza artificiale) a risolvere problemi di fisica complessi, come quelli che si trovano nei libri di testo universitari o nei test d'ingresso per le ingegneria. Il problema è che per imparare bene, il robot ha bisogno di milioni di esercizi, ma trovare o scrivere manualmente così tanti problemi corretti è impossibile. Inoltre, se provi a far scrivere questi esercizi a un'altra intelligenza artificiale "normale", spesso inventa cose che sembrano vere ma sono matematicamente sbagliate (le chiamano "allucinazioni").

Gli autori di questo studio, tre ricercatori indiani, hanno creato una soluzione geniale chiamata IPG (Infinite Problem Generator). Ecco come funziona, spiegato con parole semplici e qualche analogia divertente.

1. Il Problema: L'Artista che Sogna

Immagina di chiedere a un pittore molto bravo (un'IA generica) di dipingere un quadro di un'auto che corre. Lui potrebbe dipingere un'auto bellissima, ma se gli chiedi di calcolare quanto tempo impiega a fare un giro, potrebbe dire "10 secondi" anche se l'auto è ferma. L'IA è brava a scrivere parole, ma non è brava a fare i conti veri. Spesso inventa soluzioni che sembrano plausibili ma sono sbagliate.

2. La Soluzione: Il "Ricettario" di Codice

Gli autori hanno avuto un'idea brillante: invece di far scrivere al robot la soluzione in parole (come un testo), gli hanno chiesto di scriverla come un programma informatico (codice Python) che può essere eseguito da un computer.

Hanno usato un approccio che chiamano "Formula come Codice".

  • L'analogia: Immagina che le leggi della fisica (come la gravità o la velocità) non siano scritte su un foglio di carta, ma siano dei robot cuochi già programmati.
    • Se vuoi calcolare la velocità, non scrivi la formula a mano. Chiami il "Robot Velocità".
    • Se vuoi calcolare la forza, chiami il "Robot Forza".
    • Il robot che genera il problema non inventa la ricetta; usa solo i robot cuochi esistenti e verificati.

3. Come Funziona la Macchina (Il Processo in 3 Atti)

Il sistema IPG lavora come un'agenzia di viaggi molto rigorosa che organizza un tour:

  • Fase 1: L'Ispettore (Analisi)
    Prende un problema di fisica "seme" (fatto da un umano esperto) e lo analizza. Chiede: "Di quali ingredienti (formule) abbiamo bisogno? In quali contesti reali possiamo usare questa ricetta? (Es. invece di un'auto, usiamo un razzo o una ruota di bicicletta)".
  • Fase 2: Il Creatore (Generazione)
    Crea nuove storie basate su quelle ricette. "Ok, invece di un'auto che frena, facciamo un pattinatore che si ferma". Ma qui c'è il trucco: deve usare solo i robot cuochi (formule) che gli sono stati dati. Non può inventare nuove leggi della fisica.
  • Fase 3: Il Controllore (Verifica)
    Questo è il passaggio magico. Prima di dire "Ecco il problema!", il sistema fa girare il codice che il robot ha scritto.
    • Se il codice si blocca? Scartato.
    • Se il risultato è un numero assurdo (es. un'auto che va a 1000 km/h o una massa negativa)? Scartato.
    • Se il codice gira e dà un risultato sensato? Accettato!

4. Il Risultato: Un Giardino Infinito di Esercizi

Grazie a questo metodo, partendo da soli 165 problemi scritti da umani, sono riusciti a generare 1.335 nuovi problemi unici, tutti verificati matematicamente.

Hanno scoperto anche una cosa affascinante, che chiamano "La Mappa della Complessità":

  • Hanno notato che più formule servono per risolvere un problema, più lungo è il codice necessario per risolverlo.
  • È come se la "lunghezza del codice" fosse un metro perfetto per misurare quanto è difficile un problema. Se vuoi creare un esercizio difficile, basta chiedere al sistema di scrivere un codice più lungo!

5. Perché è Importante?

Prima di questo lavoro, per addestrare le intelligenze artificiali a ragionare, si usavano dati pieni di errori o esercizi troppo semplici.
Con IPG, abbiamo:

  1. Niente bugie: Ogni problema ha una soluzione che il computer ha provato e verificato.
  2. Infinite variazioni: Puoi creare milioni di esercizi diversi sullo stesso concetto (es. fisica rotazionale) senza che siano tutti uguali.
  3. Un banco di prova perfetto: Ora possiamo testare le intelligenze artificiali su problemi che richiedono davvero di ragionare, non solo di indovinare.

In sintesi: Gli autori hanno costruito una fabbrica di problemi di fisica dove il "capo" non è un umano che scrive a mano, ma un sistema che usa le leggi della fisica come pezzi di Lego pre-costruiti e li assembla solo se il risultato finale funziona davvero. È come avere un insegnante di fisica che non si stanca mai, non sbaglia mai i calcoli e può creare un nuovo esercizio ogni secondo, per sempre.

Ricevi articoli come questo nella tua casella di posta

Digest giornalieri o settimanali personalizzati in base ai tuoi interessi. Riassunti Gist o tecnici, nella tua lingua.

Prova Digest →