Distilled Circuits: A Mechanistic Study of Internal Restructuring in Knowledge Distillation
Dit onderzoek toont aan dat kennisdistillatie, hoewel het de output van grotere modellen behoudt, leidt tot significante interne herschikkingen waarbij studentenonderdelen worden gecomprimeerd en herorganiseerd, wat gevolgen heeft voor de robuustheid en generalisatie van deze modellen.