Sample-Based Hybrid Mode Control: Asymptotically Optimal Switching of Algorithmic and Non-Differentiable Control Modes

Este artículo presenta un método de control híbrido basado en muestras que formula la selección y el cambio de modos de control como un problema de optimización entera, logrando garantías de rendimiento óptimo y demostrando su eficacia en tareas robóticas que requieren una conmutación reactiva entre planificación a largo plazo y control de alta frecuencia.

Yilang Liu, Haoxiang You, Ian Abraham2026-03-09💻 cs

Push Anything: Single- and Multi-Object Pushing From First Sight with Contact-Implicit MPC

Este trabajo presenta C3+, un algoritmo mejorado de control predictivo basado en modelos con contacto implícito que permite empujar con éxito y en tiempo real objetos individuales y múltiples de diversas formas, logrando una tasa de éxito del 98% en implementaciones físicas.

Hien Bui, Yufeiyang Gao, Haoran Yang, Eric Cui, Siddhant Mody, Brian Acosta, Thomas Stephen Felix, Bibit Bianchini, Michael Posa2026-03-09💻 cs

ExpReS-VLA: Specializing Vision-Language-Action Models Through Experience Replay and Retrieval

El artículo presenta ExpReS-VLA, un método que especializa rápidamente los modelos de Visión-Lenguaje-Acción (VLA) preentrenados para dominios específicos mediante la recuperación de experiencias comprimidas y un mecanismo de aprendizaje contrastivo, logrando una adaptación eficiente en el dispositivo que previene el olvido catastrófico y mejora significativamente el rendimiento en tareas robóticas tanto en simulación como en robots físicos.

Shahram Najam Syed, Yatharth Ahuja, Arthur Jakobsson, Jeff Ichnowski2026-03-09💻 cs

Bi-AQUA: Bilateral Control-Based Imitation Learning for Underwater Robot Arms via Lighting-Aware Action Chunking with Transformers

El artículo presenta Bi-AQUA, un marco pionero de aprendizaje por imitación bilateral para brazos robóticos submarinos que integra un diseño consciente de la iluminación basado en transformadores para lograr una manipulación robusta y adaptable a las variaciones lumínicas en entornos subacuáticos.

Takeru Tsunoori, Masato Kobayashi, Yuki Uranishi2026-03-09💻 cs

EchoVLA: Synergistic Declarative Memory for VLA-Driven Mobile Manipulation

El artículo presenta EchoVLA, un modelo de Visión-Lenguaje-Acción con memoria declarativa sinérgica que combina mapas espaciales-semánticos y experiencias episódicas para superar las limitaciones de los modelos actuales y lograr un manejo móvil más eficaz, validado mediante el nuevo benchmark automatizado MoMani.

Min Lin, Xiwen Liang, Bingqian Lin, Liu Jingzhi, Zijian Jiao, Kehan Li, Yu Sun, Weijia Liufu, Yuhan Ma, Yuecheng Liu, Shen Zhao, Yuzheng Zhuang, Xiaodan Liang2026-03-09💻 cs

Safe Autonomous Lane Changing: Planning with Dynamic Risk Fields and Time-Varying Convex Space Generation

Este artículo presenta un pipeline de planificación de trayectorias para cambios de carril autónomos que integra campos de riesgo dinámicos y espacios convexos variables en el tiempo dentro de un marco de optimización resuelto mediante iLQR, logrando trayectorias más seguras, eficientes y suaves que los métodos tradicionales en escenarios de tráfico complejos.

Yijun Lu, Zhihao Lin, Zhen Tian2026-03-09💻 cs

XR-DT: Extended Reality-Enhanced Digital Twin for Safe Motion Planning via Human-Aware Model Predictive Path Integral Control

Este artículo presenta XR-DT, un marco de gemelo digital potenciado por realidad extendida que integra el modelo de control HA-MPPI y la predicción de trayectorias humanas ATLAS para lograr una planificación de movimiento segura, eficiente e interpretable en entornos compartidos entre humanos y robots.

Tianyi Wang, Jiseop Byeon, Ahmad Yehia, Yiming Xu, Jihyung Park, Tianyi Zeng, Sikai Chen, Ziran Wang, Junfeng Jiao, Christian Claudel2026-03-09🤖 cs.AI

VISO: Robust Underwater Visual-Inertial-Sonar SLAM with Photometric Rendering for Dense 3D Reconstruction

El artículo presenta VISO, un sistema SLAM robusto para entornos submarinos que fusiona cámaras estéreo, IMU y sonar 3D mediante calibración en línea y renderizado fotométrico para lograr una localización precisa y una reconstrucción 3D densa en tiempo real con alta fidelidad.

Shu Pan, Simon Archieri, Ahmet Cinar, Jonatan Scharff Willners, Ignacio Carlucho, Yvan Petillot2026-03-09💻 cs

(MGS)2^2-Net: Unifying Micro-Geometric Scale and Macro-Geometric Structure for Cross-View Geo-Localization

El artículo presenta (MGS)2^2-Net, un marco innovador para la geolocalización cruzada que unifica la adaptación de escala micro-geométrica y el filtrado de estructura macro-geométrica para superar las desalineaciones entre vistas aéreas oblicuas y satelitales, logrando un rendimiento de vanguardia en la navegación de UAVs sin GNSS.

Minglei Li, Mengfan He, Chunyu Li, Chao Chen, Xingyu Shao, Ziyang Meng2026-03-09💻 cs

APEX: Learning Adaptive High-Platform Traversal for Humanoid Robots

El artículo presenta APEX, un sistema basado en aprendizaje por refuerzo profundo que permite a un robot humanoide Unitree G1 de 29 grados de libertad escalar y descender plataformas de hasta 0,8 metros (aproximadamente el 114% de su longitud de pierna) mediante una recompensa de progreso tipo trinquete y una estrategia dual para reducir la brecha simulación-realidad, logrando así una transición fluida y segura entre múltiples habilidades de locomoción.

Yikai Wang, Tingxuan Leng, Changyi Lin, Shiqi Liu, Shir Simon, Bingqing Chen, Jonathan Francis, Ding Zhao2026-03-09💻 cs