How Well Do AI Systems Solve AP Physics? A Comparative Evaluation of Large Language Models on Algebra-Based Free Response Questions
Este estudo avalia o desempenho de quatro modelos de linguagem avançados em questões dissertativas de Física AP, revelando que, embora apresentem alta precisão em problemas algébricos estruturados, eles ainda enfrentam limitações significativas em raciocínio espacial, interpretação visual e integração conceitual.