Reasoning With a Star: A Heliophysics Dataset and Benchmark for Agentic Scientific Reasoning
이 논문은 헬리오피직스(태양물리학) 분야의 과학적 추론 능력을 평가하기 위해 물리적 가정, 단위 일관성, 과학적 형식을 포함하는 새로운 데이터셋인 'Reasoning With a Star'를 제안하고, 멀티 에이전트 워크플로우가 단순 프롬프팅보다 연역적 추론 문제 해결에 더 효과적임을 입증했습니다.