How Well Do AI Systems Solve AP Physics? A Comparative Evaluation of Large Language Models on Algebra-Based Free Response Questions
본 논문은 2015 년부터 2025 년까지의 AP 물리학 자유응답 문제를 대상으로 주요 AI 모델들의 성능을 평가한 결과, 대수적 문제 해결에는 탁월한 능력을 보이지만 그래프 해석, 벡터 방향 추론, 3 차원 공간 개념 적용 등 시각적·개념적 통합이 필요한 영역에서는 여전히 한계가 있음을 규명했습니다.