World2Act: Latent Action Post-Training via Skill-Compositional World Models
O artigo apresenta o World2Act, um framework de pós-treinamento que alinha ações de políticas VLA diretamente com latentes de dinâmica de vídeo de modelos de mundo, utilizando decomposição de habilidades baseada em LLM para superar limitações de geração temporal e alcançar resultados state-of-the-art em tarefas robóticas.