Sparse Crosscoders for diffing MoEs and Dense models
Este estudio utiliza crosscoders para comparar modelos MoE y densos, revelando que los MoE desarrollan representaciones más especializadas con menos características únicas y mayor densidad de activación en sus características específicas, mientras que los modelos densos distribuyen la información en características más amplias y generalistas.