The CompMath-MCQ Dataset: Are LLMs Ready for Higher-Level Math?
Ce papier présente CompMath-MCQ, un nouveau jeu de données de 1 500 questions à choix multiples conçues par des professeurs pour évaluer les capacités de raisonnement mathématique avancé des modèles de langage, révélant que ces derniers peinent encore à maîtriser ce niveau de complexité.