Self-Correcting VLA: Online Action Refinement via Sparse World Imagination
Die Arbeit stellt SC-VLA vor, ein selbstkorrigierendes Vision-Language-Action-Modell, das durch die Integration einer spärlichen Weltimagination und eines Online-Aktionsverfeinerungsmoduls die physische Robustheit und Erfolgsrate bei Robotermanipulationsaufgaben im Vergleich zu bestehenden Methoden signifikant verbessert.