Emergence of Superposition: Unveiling the Training Dynamics of Chain of Continuous Thought
Cette étude théorique et expérimentale révèle comment le mécanisme de superposition, permettant le raisonnement parallèle implicite dans la chaîne de pensée continue, émerge naturellement lors de l'entraînement d'un transformateur à deux couches sur le problème de l'accessibilité dans les graphes orientés grâce à un équilibre dynamique entre l'exploration et l'exploitation.