How Well Do AI Systems Solve AP Physics? A Comparative Evaluation of Large Language Models on Algebra-Based Free Response Questions
Questo studio valuta le prestazioni di quattro sistemi di intelligenza artificiale su domande a risposta libera dell'AP Physics, rivelando che, sebbene ottengano punteggi medi elevati nella risoluzione di problemi algebrici strutturati, mostrano limitazioni significative nel ragionamento spaziale, nell'interpretazione visiva e nell'integrazione concettuale, con prestazioni variabili tra i diversi modelli e anni.