When Does Critique Improve AI-Assisted Theoretical Physics? SCALAR: Structured Critic--Actor Loop for Agentic Reasoning
Este artigo apresenta o SCALAR, uma estrutura estruturada de Ator-Crítico-Juiz que demonstra como o diálogo multi-turno e estratégias específicas de feedback crítico, particularmente em pares assimétricos, melhoram significativamente o desempenho da IA em problemas complexos de física teórica, ao mesmo tempo que revelam que a simples escalabilidade do modelo não consegue superar os gargalos mais difíceis de raciocínio.