RehearseVLA: Simulated Post-Training for VLAs with Physically-Consistent World Model

Il paper presenta RehearseVLA, un framework di post-addestramento basato sul reinforcement learning che utilizza un simulatore di mondo fisicamente coerente e un riflettore guidato da modelli visione-linguaggio per migliorare l'efficienza dei modelli VLA in scenari a dati scarsi e ambienti reali non resettabili, ottenendo prestazioni elevate con pochissime dimostrazioni.

Junjin Xiao, Yandan Yang, Xinyuan Chang + 5 more2026-03-05💻 cs

LaViRA: Language-Vision-Robot Actions Translation for Zero-Shot Vision Language Navigation in Continuous Environments

Il paper presenta LaViRA, un framework zero-shot per la navigazione visione-linguaggio in ambienti continui che supera i limiti degli approcci attuali decomponendo l'azione in una gerarchia di pianificazione linguistica, ancoraggio visivo e controllo robotico, ottenendo così prestazioni superiori e una migliore generalizzazione su ambienti non visti.

Hongyu Ding, Ziming Xu, Yudong Fang + 6 more2026-03-05💻 cs

SoraNav: Adaptive UAV Task-Centric Navigation via Zeroshot VLM Reasoning

Il paper presenta SoraNav, un nuovo framework che abilita la navigazione autonoma di droni UAV basata su istruzioni linguistiche mediante ragionamento zero-shot di modelli VLM, superando le limitazioni spaziali esistenti attraverso annotazioni visive multi-modali e una strategia di decisione adattiva che garantisce prestazioni superiori in ambienti 2.5D e 3D complessi.

Hongyu Song, Rishabh Dev Yadav, Cheng Guo + 1 more2026-03-05💻 cs

Learning Physical Principles from Interaction: Self-Evolving Planning via Test-Time Memory

Il paper presenta PhysMem, un framework di memoria che permette ai pianificatori robotici basati su modelli visione-linguaggio di apprendere e verificare principi fisici durante l'interazione a tempo di test senza aggiornare i parametri del modello, migliorando significativamente il successo nelle attività di manipolazione rispetto alla semplice ricerca di esperienze dirette.

Haoyang Li, Yang You, Hao Su + 1 more2026-03-05🤖 cs.AI

Multi-Agent-Based Simulation of Archaeological Mobility in Uneven Landscapes

Questo articolo presenta un framework di modellazione basato su agenti multipli che simula la mobilità archeologica in paesaggi irregolari, integrando dati topografici reali, agenti eterogenei e strategie di navigazione adattive per analizzare come il terreno e le caratteristiche fisiche influenzino i movimenti e le interazioni umane e animali nel passato.

Chairi Kiourt, Vassilis Evangelidis, Dimitris Grigoropoulos2026-03-05🤖 cs.AI