From Solver to Tutor: Evaluating the Pedagogical Intelligence of LLMs with KMP-Bench
이 논문은 LLM 의 수학적 튜터링 능력을 종합적으로 평가하기 위해 KMP-Bench 벤치마크와 대규모 대화 데이터셋 KMP-Pile 을 제안하며, 현재 최첨단 모델이 검증 가능한 문제 해결에는 탁월하지만 교훈적 원리의 정교한 적용에는 한계가 있음을 드러내고 KMP-Pile 로 미세 조정 시 성능이 크게 향상됨을 보여줍니다.