Chain of World: World Model Thinking in Latent Motion
L'article présente CoWVLA, une nouvelle approche unifiant le raisonnement temporel des modèles de monde et une représentation latente de mouvement déségréguée pour améliorer l'apprentissage visuomoteur des modèles Vision-Language-Action.