Decision-Driven Semantic Object Exploration for Legged Robots via Confidence-Calibrated Perception and Topological Subgoal Selection

Questo lavoro propone un approccio basato sulla visione per l'esplorazione semantica di oggetti da parte di robot a zampe, che utilizza un'arbitratura delle evidenze semantiche calibrata sulla confidenza, una memoria topologica a crescita controllata e una selezione di sottobiettivi guidata dall'utilità semantica per prendere decisioni di esplorazione stabili ed eseguibili senza dipendere da ricostruzioni geometriche dense.

Guoyang Zhao, Yudong Li, Weiqing Qi, Kai Zhang, Bonan Liu, Kai Chen, Haoang Li, Jun Ma2026-03-09💻 cs

Sample-Based Hybrid Mode Control: Asymptotically Optimal Switching of Algorithmic and Non-Differentiable Control Modes

Questo articolo presenta un approccio basato su campioni per il controllo ibrido che risolve un problema di ottimizzazione intera per selezionare dinamicamente il modo di controllo, il momento di commutazione e la durata, garantendo prestazioni asintoticamente ottimali e permettendo la sintesi di comportamenti complessi in compiti robotici reali.

Yilang Liu, Haoxiang You, Ian Abraham2026-03-09💻 cs

Push Anything: Single- and Multi-Object Pushing From First Sight with Contact-Implicit MPC

Questo lavoro presenta C3+, un algoritmo di controllo MPC che ignora i contatti, in grado di eseguire con successo e in tempo reale compiti di spinta planare su un'ampia varietà di oggetti singoli e multipli, raggiungendo un tasso di successo del 98% su hardware reale.

Hien Bui, Yufeiyang Gao, Haoran Yang, Eric Cui, Siddhant Mody, Brian Acosta, Thomas Stephen Felix, Bibit Bianchini, Michael Posa2026-03-09💻 cs

ExpReS-VLA: Specializing Vision-Language-Action Models Through Experience Replay and Retrieval

Il paper presenta ExpReS-VLA, un metodo che specializza i modelli Vision-Language-Action pre-addestrati per ambienti specifici tramite un efficiente replay di esperienze compresso e generazione aumentata dal recupero, prevenendo l'oblio catastrofico e migliorando significativamente le prestazioni sia in simulazione che su robot fisici con un adattamento rapido e a basso costo di memoria.

Shahram Najam Syed, Yatharth Ahuja, Arthur Jakobsson, Jeff Ichnowski2026-03-09💻 cs

Symmetry-Breaking in Multi-Agent Navigation: Winding Number-Aware MPC with a Learned Topological Strategy

Il paper presenta WNumMPC, un metodo di navigazione gerarchico che risolve i deadlock simmetrici in sistemi multi-agente privi di comunicazione esplicita combinando un piano basato sull'apprendimento per rinforzo, che utilizza l'invariante topologico del numero di avvolgimento per definire strategie cooperative, con un controller basato su modelli per generare traiettorie sicure ed efficienti.

Tomoki Nakao, Kazumi Kasaura, Tadashi Kozuno2026-03-09💻 cs

Bi-AQUA: Bilateral Control-Based Imitation Learning for Underwater Robot Arms via Lighting-Aware Action Chunking with Transformers

Il paper presenta Bi-AQUA, un innovativo framework di apprendimento per imitazione basato sul controllo bilaterale che integra modelli specifici per l'illuminazione tramite trasformatori, permettendo ai bracci robotici sottomarini di eseguire con successo compiti di manipolazione complessi nonostante le variazioni e il degrado della visibilità tipici degli ambienti acquatici.

Takeru Tsunoori, Masato Kobayashi, Yuki Uranishi2026-03-09💻 cs

EchoVLA: Synergistic Declarative Memory for VLA-Driven Mobile Manipulation

Il paper presenta EchoVLA, un modello VLA arricchito da una memoria dichiarativa sinergica ispirata al cervello umano che combina memoria scenica ed episodica per migliorare significativamente le prestazioni dei robot mobili nella manipolazione e navigazione a lungo termine, supportato dal nuovo benchmark automatizzato MoMani.

Min Lin, Xiwen Liang, Bingqian Lin, Liu Jingzhi, Zijian Jiao, Kehan Li, Yu Sun, Weijia Liufu, Yuhan Ma, Yuecheng Liu, Shen Zhao, Yuzheng Zhuang, Xiaodan Liang2026-03-09💻 cs

XR-DT: Extended Reality-Enhanced Digital Twin for Safe Motion Planning via Human-Aware Model Predictive Path Integral Control

Questo articolo presenta XR-DT, un framework di Gemello Digitale potenziato dalla Realtà Estesa che integra un modello di controllo predittivo HA-MPPI e un sistema di previsione delle traiettorie umane basato su Transformer per garantire una pianificazione sicura ed efficiente della navigazione robotica in ambienti condivisi con esseri umani.

Tianyi Wang, Jiseop Byeon, Ahmad Yehia, Yiming Xu, Jihyung Park, Tianyi Zeng, Sikai Chen, Ziran Wang, Junfeng Jiao, Christian Claudel2026-03-09🤖 cs.AI