MEM: Multi-Scale Embodied Memory for Vision Language Action Models

Il paper introduce MEM (Multi-Scale Embodied Memory), un'architettura di memoria multimodale che combina ricordi a breve termine basati su video e ricordi a lungo termine basati su testo per abilitare i robot a eseguire compiti complessi e di lunga durata, come pulire una cucina o preparare un panino, adattando intelligentemente le proprie strategie di manipolazione.

Marcel Torne, Karl Pertsch, Homer Walke + 14 more2026-03-05🤖 cs.LG

UrbanHuRo: A Two-Layer Human-Robot Collaboration Framework for the Joint Optimization of Heterogeneous Urban Services

Il paper propone UrbanHuRo, un framework di collaborazione uomo-robot a due livelli che ottimizza congiuntamente servizi urbani eterogenei, come le consegne e il rilevamento ambientale, migliorando significativamente la copertura sensoriale, il reddito dei corrieri e l'efficienza operativa attraverso algoritmi distribuiti e apprendimento per rinforzo.

Tonmoy Dey, Lin Jiang, Zheng Dong + 1 more2026-03-05🤖 cs.AI

Interaction-Aware Whole-Body Control for Compliant Object Transport

Questo articolo presenta un controllo corporeo intero orientato all'interazione (IO-WBC), ispirato al cervelletto biologico e basato su apprendimento per rinforzo, che permette agli umanoidi assistivi di trasportare oggetti in modo compliant e stabile in ambienti non strutturati, separando l'esecuzione dell'interazione superiore dal supporto inferiore per gestire forze di contatto variabili senza dipendere dal tracciamento preciso della velocità.

Hao Zhang, Yves Tseng, Ding Zhao + 1 more2026-03-05🤖 cs.AI

Pretrained Vision-Language-Action Models are Surprisingly Resistant to Forgetting in Continual Learning

Questo studio dimostra che i modelli preaddestrati Vision-Language-Action (VLA) sono sorprendentemente resistenti all'oblio nell'apprendimento continuo, superando i modelli più piccoli grazie alla pre-addestramento che, combinato con una semplice riproduzione delle esperienze, permette di acquisire nuove competenze senza dimenticare quelle precedenti e di recuperare rapidamente le abilità apparentemente perse.

Huihan Liu, Changyeon Kim, Bo Liu + 2 more2026-03-05🤖 cs.AI

Self-adapting Robotic Agents through Online Continual Reinforcement Learning with World Model Feedback

Questo lavoro presenta un framework di apprendimento per rinforzo continuo online, ispirato biologicamente e basato su DreamerV3, che permette agli agenti robotici di adattarsi autonomamente a cambiamenti imprevisti durante il deployment rilevando errori di previsione del modello del mondo e attivando un fine-tuning automatico monitorato senza supervisione esterna.

Fabian Domberg, Georg Schildbach2026-03-05🤖 cs.AI

Sim2Sea: Sim-to-Real Policy Transfer for Maritime Vessel Navigation in Congested Waters

Il paper presenta Sim2Sea, un framework che colma il divario tra simulazione e realtà per la navigazione autonoma in acque affollate, combinando un simulatore GPU accelerato, una politica spaziotemporale a doppio flusso con mascheramento delle azioni sicuro e una randomizzazione del dominio mirata, permettendo il trasferimento zero-shot su un vero veicolo autonomo marino.

Xinyu Cui, Xuanfa Jin, Xue Yan + 7 more2026-03-05🤖 cs.AI

SaFeR: Safety-Critical Scenario Generation for Autonomous Driving Test via Feasibility-Constrained Token Resampling

Il paper propone SaFeR, un metodo innovativo per la generazione di scenari critici per la guida autonoma che bilancia adversarialità, fattibilità fisica e realismo comportamentale attraverso un meccanismo di attenzione differenziale e una strategia di ricampionamento vincolata da una regione di fattibilità approssimata tramite apprendimento per rinforzo.

Jinlong Cui, Fenghua Liang, Guo Yang + 2 more2026-03-05🤖 cs.AI

Learning Hip Exoskeleton Control Policy via Predictive Neuromusculoskeletal Simulation

Questo studio presenta un framework di apprendimento basato su simulazioni neuromuscoloscheletriche fisiche che addestra una politica di controllo per un esoscheletro dell'anca esclusivamente in ambiente simulato, dimostrandone il trasferimento efficace su hardware reale con riduzioni misurabili dell'attivazione muscolare e del lavoro articolare senza necessità di dati di movimento o sintonizzazioni aggiuntive.

Ilseung Park, Changseob Song, Inseung Kang2026-03-05🤖 cs.LG

VANGUARD: Vehicle-Anchored Ground Sample Distance Estimation for UAVs in GPS-Denied Environments

Il paper presenta VANGUARD, uno strumento geometrico deterministico che permette agli agenti autonomi di stimare la distanza campione a terra (GSD) in ambienti privi di GPS rilevando veicoli come ancoraggi spaziali, risolvendo così le allucinazioni di scala dei modelli VLM e garantendo una ragionamento spaziale sicuro e metricamente accurato.

Yifei Chen, Xupeng Chen, Feng Wang + 2 more2026-03-05🤖 cs.AI

RoboCasa365: A Large-Scale Simulation Framework for Training and Benchmarking Generalist Robots

Il paper presenta RoboCasa365, un ampio framework di simulazione basato su 365 compiti quotidiani in 2.500 ambienti cucina diversi e oltre 2.200 ore di dati dimostrativi, progettato per valutare e migliorare le politiche dei robot generalisti attraverso esperimenti sistematici su apprendimento multi-task, modelli fondazionali e apprendimento continuo.

Soroush Nasiriany, Sepehr Nasiriany, Abhiram Maddukuri + 1 more2026-03-05🤖 cs.AI