Sparse Crosscoders for diffing MoEs and Dense models
Este artigo utiliza crosscoders para comparar modelos MoE e densos, revelando que os MoE aprendem menos recursos únicos e mais especializados com maior densidade de ativação, enquanto os modelos densos distribuem a informação em recursos mais gerais e amplos.