From Solver to Tutor: Evaluating the Pedagogical Intelligence of LLMs with KMP-Bench
Deze paper introduceert KMP-Bench, een uitgebreid benchmark voor K-8 wiskundepedagogiek, en KMP-Pile, een groot dataset, om de pedagogische intelligentie van LLM's te evalueren en aan te tonen dat fijnafstemming op pedagogisch rijke data de effectiviteit van AI-tutors aanzienlijk verbetert.