When Does Critique Improve AI-Assisted Theoretical Physics? SCALAR: Structured Critic--Actor Loop for Agentic Reasoning
Questo articolo introduce SCALAR, un framework strutturato Actor-Critic-Judge che dimostra come il dialogo multi-turno e strategie specifiche di feedback critico, in particolare nelle coppie asimmetriche, migliorino significativamente le prestazioni dell'IA su problemi complessi di fisica teorica, rivelando al contempo che la sola scalabilità dei modelli non è sufficiente a superare i colli di bottiglia più difficili del ragionamento.