World Guidance: World Modeling in Condition Space for Action Generation
Il paper presenta WoG (World Guidance), un framework che migliora la generazione di azioni nei modelli Vision-Language-Action mappando le osservazioni future in condizioni compatte all'interno del processo di inferenza, ottenendo così una modellazione del mondo efficace che garantisce una generazione di azioni più precisa e una migliore generalizzazione.