Distilled Circuits: A Mechanistic Study of Internal Restructuring in Knowledge Distillation
Este estudo utiliza técnicas de interpretabilidade mecânica para demonstrar que a destilação de conhecimento, embora preserve comportamentos funcionais amplos, provoca uma reestruturação interna significativa nos modelos, onde os estudantes reorganizam e comprimem os componentes dos professores, resultando em uma dependência mais forte de menos unidades individuais.