Lifelong Embodied Navigation Learning

Il paper propone Uni-Walker, un framework di apprendimento incarnato a vita che risolve il problema della rimozione catastrofica nei agenti di navigazione potenziati da LLM, decoulando le conoscenze in componenti condivise e specifiche tramite DE-LoRA e strategie di eredità e ortogonalità per adattarsi a compiti e stili di istruzioni diversi mantenendo le competenze apprese in precedenza.

Xudong Wang, Jiahua Dong, Baichen Liu, Qi Lyu, Lianqing Liu, Zhi Han2026-03-09🤖 cs.AI

Multimodal Behavior Tree Generation: A Small Vision-Language Model for Robot Task Planning

Questo lavoro propone un metodo per generare alberi comportamentali per la pianificazione di compiti robotici utilizzando un modello visione-linguaggio (VLM) compatto e open-source, che viene addestrato su un nuovo dataset derivato da episodi robotici esistenti e dimostra prestazioni competitive con modelli chiusi su larga scala pur richiedendo risorse computazionali significativamente inferiori.

Cristiano Battistini, Riccardo Andrea Izzo, Gianluca Bardaro, Matteo Matteucci2026-03-09💻 cs

Sticky-Glance: Robust Intent Recognition for Human Robot Collaboration via Single-Glance

Il paper propone "Sticky-Glance", un framework robusto per il riconoscimento delle intenzioni basato sullo sguardo che, tramite un algoritmo di "sguardo adesivo" e un controllo condiviso continuo, permette alle persone con limitate capacità motorie di interagire efficacemente con robot in ambienti dinamici, riducendo il carico di lavoro e il tempo di esecuzione dei compiti.

Yuzhi Lai, Shenghai Yuan, Peizheng Li, Andreas Zell2026-03-09💻 cs

Dual-Agent Multiple-Model Reinforcement Learning for Event-Triggered Human-Robot Co-Adaptation in Decoupled Task Spaces

Questo articolo presenta una strategia di controllo condiviso per la riabilitazione robotica che, integrando un meccanismo di attivazione basato su eventi e un algoritmo di apprendimento per rinforzo a doppio agente (DAMMRL), ottimizza la co-adattazione uomo-robot in spazi di compito disaccoppiati, migliorando precisione ed efficienza nei compiti di raggiungimento.

Yaqi Li, Zhengqi Han, Huifang Liu, Steven W. Su2026-03-09💻 cs

DreamToNav: Generalizable Navigation for Robots via Generative Video Planning

Il paper presenta DreamToNav, un innovativo framework di navigazione robotica che utilizza modelli generativi video per tradurre prompt linguistici naturali in traiettorie eseguibili, permettendo a robot di diverse locomozioni di pianificare e realizzare compiti complessi con un'accuratezza significativa senza necessità di ingegnerizzazione specifica per ogni attività.

Valerii Serpiva, Jeffrin Sam, Chidera Simon, Hajira Amjad, Iana Zhura, Artem Lykov, Dzmitry Tsetserukou2026-03-09💻 cs

KISS-IMU: Self-supervised Inertial Odometry with Motion-balanced Learning and Uncertainty-aware Inference

Il paper presenta KISS-IMU, un nuovo framework di odometria inerziale auto-supervisionato che elimina la dipendenza dai dati di verità fondamentale sfruttando la registrazione ICP basata su LiDAR e l'ottimizzazione del grafo delle pose, garantendo robustezza attraverso un addestramento bilanciato per il movimento e un'inferenza adattiva guidata dall'incertezza.

Jiwon Choi, Hogyun Kim, Geonmo Yang, Juhui Lee, Younggun Cho2026-03-09💻 cs

TaPD: Temporal-adaptive Progressive Distillation for Observation-Adaptive Trajectory Forecasting in Autonomous Driving

Il paper presenta TaPD, un framework unificato e plug-and-play che utilizza la distillazione progressiva temporale-adattiva e un modulo di riempimento temporale per migliorare l'accuratezza della previsione delle traiettorie in scenari di guida autonoma con storie di osservazione variabili o estremamente brevi.

Mingyu Fan, Yi Liu, Hao Zhou, Deheng Qian, Mohammad Haziq Khan, Matthias Raetsch2026-03-09🤖 cs.AI

NOVA: Next-step Open-Vocabulary Autoregression for 3D Multi-Object Tracking in Autonomous Driving

Il paper introduce NOVA, un nuovo paradigma di autoregressione open-vocabulary che sfrutta i modelli linguistici su larga scala per trasformare il tracciamento 3D di oggetti multipli in un compito di completamento di sequenze spaziotemporali, ottenendo prestazioni superiori nel tracciamento di categorie sconosciute rispetto ai metodi tradizionali.

Kai Luo, Xu Wang, Rui Fan, Kailun Yang2026-03-09💻 cs

Towards Robotic Lake Maintenance: Integrating SONAR and Satellite Data to Assist Human Operators

Questo articolo propone un approccio a due fasi per la manutenzione robotizzata di laghi artificiali, integrando dati satellitari per la rilevazione preliminare della vegetazione sommersa e mappature ad alta risoluzione tramite SONAR a bordo di veicoli di superficie non pilotati, al fine di ottimizzare il raccolto mirato e ridurre il carico di lavoro per gli operatori umani.

Ahmed H. Elsayed, Christoph Manss, Tarek A. El-Mihoub, Andrej Lejman, Frederic Stahl2026-03-09💻 cs

Can we Trust Unreliable Voxels? Exploring 3D Semantic Occupancy Prediction under Label Noise

Questo lavoro introduce il benchmark OccNL e il framework DPR-Occ per affrontare la previsione dell'occupazione semantica 3D in presenza di rumore di etichetta, dimostrando che le strategie esistenti falliscono in spazi voxel sparsi e proponendo un metodo innovativo basato sul ragionamento su etichette parziali che mantiene prestazioni elevate anche con un rumore del 90%.

Wenxin Li, Kunyu Peng, Di Wen, Junwei Zheng, Jiale Wei, Mengfei Duan, Yuheng Zhang, Rui Fan, Kailun Yang2026-03-09💻 cs

Open-Source Based and ETSI Compliant Cooperative, Connected, and Automated Mini-Cars

Questo articolo propone l'utilizzo di mini-auto in scala 1:10 basate su software open-source e conformi agli standard ETSI come soluzione economica ed efficace per colmare il divario tra simulazione e test reali di veicoli autonomi, cooperativi e connessi, dimostrando la fattibilità della piattaforma attraverso la validazione di un sistema di avviso di collisione agli incroci.

Lorenzo Farina, Federico Gavioli, Salvatore Iandolo, Francesco Moretti, Giuseppe Perrone, Matteo Piccoli, Francesco Raviglione, Marco Rapelli, Antonio Solida, Paolo Burgio, Carlo Augusto Grazia, Alessandro Bazzi2026-03-09💻 cs

Data Analogies Enable Efficient Cross-Embodiment Transfer

Questo studio dimostra che, per migliorare il trasferimento cross-embodiment nei robot, l'uso di "analogie di dati" (dimostrazioni accoppiate che allineano scenari e traiettorie tra diversi corpi robotici) è più efficace dell'aumento indiscriminato della diversità dei dati, specialmente quando si affrontano cambiamenti morfologici, portando a un incremento medio del 22,5% nel successo del trasferimento rispetto ai dataset non accoppiati.

Jonathan Yang, Chelsea Finn, Dorsa Sadigh2026-03-09💻 cs

History-Conditioned Spatio-Temporal Visual Token Pruning for Efficient Vision-Language Navigation

Il paper propone un framework di pruning dei token visivi spaziotemporali basato sulla storia, privo di riaddestramento, che riduce significativamente la latenza computazionale nei modelli Vision-Language-Action per la navigazione robotica, mantenendo un'alta accuratezza e permettendo un'implementazione in tempo reale su robot reali.

Qitong Wang, Yijun Liang, Ming Li, Tianyi Zhou, Christopher Rasmussen2026-03-09💻 cs