When Does Critique Improve AI-Assisted Theoretical Physics? SCALAR: Structured Critic--Actor Loop for Agentic Reasoning
본 논문은 비대칭 페어링에서 특히 두드러지는 다턴 대화와 특정 비판 피드백 전략이 복잡한 이론 물리학 문제에서 AI 성능을 크게 향상시키는 방식을 보여주는 구조화된 Actor-Critic-Judge 프레임워크인 SCALAR을 소개하며, 모델 스케일링만으로는 가장 어려운 추론 병목 현상을 극복할 수 없음을 밝힌다.