Distilled Circuits: A Mechanistic Study of Internal Restructuring in Knowledge Distillation
Cette étude applique l'interprétabilité mécanistique à la distillation de connaissances pour révéler comment les modèles étudiants réorganisent et compressent les circuits internes des enseignants, entraînant des changements computationnels significatifs malgré la préservation des comportements fonctionnels globaux.