PACED: Distillation at the Frontier of Student Competence
Le papier présente PACED, un cadre de distillation de modèles de langage qui optimise l'apprentissage en se concentrant théoriquement et empiriquement sur la « zone de développement proximal » du modèle élève, évitant ainsi le gaspillage de ressources sur des tâches trop faciles ou trop difficiles pour maximiser les gains de performance tout en minimisant l'oubli.