How Well Do AI Systems Solve AP Physics? A Comparative Evaluation of Large Language Models on Algebra-Based Free Response Questions
Die Studie zeigt, dass zwar aktuelle KI-Modelle bei strukturierten algebraischen Aufgaben der AP-Physik-Prüfungen hohe Punktzahlen erreichen, sie jedoch bei räumlichem Denken, der Interpretation von Diagrammen und der konzeptionellen Integration weiterhin erhebliche Defizite aufweisen.