Residual Control for Fast Recovery from Dynamics Shifts

El artículo propone una arquitectura de control residual alineada con la estabilidad que, mediante un "puerta de alineación de estabilidad" (SAG) y un policy de refuerzo congelado, permite a los sistemas robóticos recuperarse rápidamente de cambios dinámicos no observados durante la ejecución, reduciendo significativamente el tiempo de recuperación en comparación con políticas fijas o de adaptación en línea.

Nethmi Jayasinghe, Diana Gontero, Francesco Migliarba, Spencer T. Brown, Vinod K. Sangwan, Mark C. Hersam, Amit Ranjan Trivedi2026-03-10💻 cs

A Robust Antenna Provides Tactile Feedback in a Multi-legged Robot

Este artículo presenta un robot multi-pata con antenas táctiles de compliance graduado que, al mapear la deformación mecánica a estados de colisión, permite una navegación autónoma y robusta en espacios confinados mediante retroalimentación táctil, sin necesidad de visión ni información global del entorno.

Zhaochen J. Xu, Juntao He, Delfin Aydan, Malaika Taylor, Tianyu Wang, Jianfeng Lin, Wesley Dyer, Daniel I. Goldman2026-03-10💻 cs

Inverse Resistive Force Theory (I-RFT): Learning granular properties through robot-terrain physical interactions

El artículo presenta Inverse Resistive Force Theory (I-RFT), un marco de aprendizaje automático basado en física que integra la Teoría de Fuerza Resistiva Granular con Procesos Gaussianos para inferir con precisión las propiedades mecánicas de terrenos granulares a partir de fuerzas de contacto durante locomoción natural, permitiendo así una exploración autónoma y la optimización de la marcha y el diseño de pies robóticos.

Shipeng Liu, Feng Xue, Yifeng Zhang, Tarunika Ponnusamy, Feifei Qian2026-03-10💻 cs

Toward Global Intent Inference for Human Motion by Inverse Reinforcement Learning

Este artículo demuestra que es posible predecir con alta precisión los movimientos de alcance humanos mediante una única función de costo agnóstica al sujeto y a la postura, utilizando el algoritmo MO-IRL para inferir pesos temporales variables que revelan un principio de optimalidad unificado dominado por la regulación de la aceleración articular.

Sarmad Mehrdad, Maxime Sabbah, Vincent Bonnet, Ludovic Righetti2026-03-10🤖 cs.LG

Preference-Conditioned Reinforcement Learning for Space-Time Efficient Online 3D Bin Packing

El artículo presenta STEP, un método de aprendizaje por refuerzo basado en transformadores que optimiza el empaquetado 3D en línea al equilibrar dinámicamente la densidad de espacio y el tiempo de ejecución mediante la evaluación de preferencias entre múltiples acciones candidatas, logrando una reducción del 44% en el tiempo operativo sin comprometer la eficiencia espacial.

Nikita Sarawgi, Omey M. Manyar, Fan Wang, Thinh H. Nguyen, Daniel Seita, Satyandra K. Gupta2026-03-10💻 cs

Uncertainty Mitigation and Intent Inference: A Dual-Mode Human-Machine Joint Planning System

Este artículo presenta un sistema unificado de planificación conjunta humano-robot que mitiga la incertidumbre mediante dos modos complementarios: uno que utiliza conversaciones bidireccionales y búsqueda A* para resolver lagunas de conocimiento, y otro que infiere la intención humana en tiempo real mediante señales espaciales, logrando reducciones significativas en los costos de interacción y el tiempo de ejecución en entornos simulados y reales.

Zeyu Fang, Yuxin Lin, Cheng Liu, Beomyeol Yu, Zeyuan Yang, Rongqian Chen, Taeyoung Lee, Mahdi Imani, Tian Lan2026-03-10💻 cs

Reasoning Knowledge-Gap in Drone Planning via LLM-based Active Elicitation

Este artículo presenta un marco innovador para la planificación de drones que utiliza modelos de lenguaje grandes y un mecanismo de árbol neuro-simbólico (MINT) para identificar y resolver activamente lagunas de conocimiento mediante preguntas binarias óptimas, mejorando así la eficiencia y el éxito en tareas de búsqueda y rescate con una interacción humana mínima.

Zeyu Fang, Beomyeol Yu, Cheng Liu, Zeyuan Yang, Rongqian Chen, Yuxin Lin, Mahdi Imani, Tian Lan2026-03-10💻 cs

Physics-infused Learning for Aerial Manipulator in Winds and Near-Wall Environments

Este artículo presenta un marco de control unificado para manipuladores aéreos que combina un modelo aerodinámico basado en física con un estimador residual de aprendizaje automático y una estrategia de adaptación en línea, logrando una mayor precisión en el seguimiento de trayectorias y una ejecución robusta de tareas de contacto con paredes en entornos con vientos complejos y cerca de estructuras.

Yiming Zhang, Junyi Geng2026-03-10💻 cs

Relating Reinforcement Learning to Dynamic Programming-Based Planning

Este artículo cierra la brecha entre la planificación óptima y el aprendizaje por refuerzo al desarrollar una versión desrandomizada de este último, analizar matemáticamente las condiciones de equivalencia entre minimización de costos y maximización de recompensas, y abogar por la optimización del "verdadero costo" en lugar de depender de parámetros arbitrarios.

Filip V. Georgiev, Kalle G. Timperi, Basak Sakçak, Steven M. LaValle2026-03-10💻 cs

Viewpoint-Agnostic Grasp Pipeline using VLM and Partial Observations

Este artículo presenta un pipeline de agarre guiado por lenguaje para manipuladores móviles que combina detección de objetos, completado de nubes de puntos y filtrado de colisiones para lograr una ejecución robusta en entornos desordenados con observaciones parciales, logrando un 90% de éxito en pruebas reales frente al 30% de un método dependiente de la vista.

Dilermando Almeida, Juliano Negri, Guilherme Lazzarini, Thiago H. Segreto, Ranulfo Bezerra, Ricardo V. Godoy, Marcelo Becker2026-03-10🤖 cs.LG

Choose What to Observe: Task-Aware Semantic-Geometric Representations for Visuomotor Policy

Este trabajo propone una interfaz de observación consciente de la tarea que, mediante la segmentación y la inyección de profundidad semántica, transforma las entradas visuales en representaciones normalizadas que mejoran significativamente la robustez de las políticas visuomotoras ante cambios de apariencia sin necesidad de reentrenamiento.

Haoran Ding, Liang Ma, Yaxun Yang, Wen Yang, Tianyu Liu, Anqing Duan, Xiaodan Liang, Dezhen Song, Ivan Laptev, Yoshihiko Nakamura2026-03-10💻 cs

RoboRouter: Training-Free Policy Routing for Robotic Manipulation

El documento presenta RoboRouter, un marco de enrutamiento de políticas sin entrenamiento que mejora el rendimiento de la manipulación robótica al seleccionar dinámicamente la mejor política existente para cada tarea mediante representaciones semánticas y experiencia acumulada, logrando aumentos significativos en las tasas de éxito tanto en simulación como en entornos reales.

Yiteng Chen, Zhe Cao, Hongjia Ren, Chenjie Yang, Wenbo Li, Shiyi Wang, Yemin Wang, Li Zhang, Yanming Shao, Zhenjun Zhao, Huiping Zhuang, Qingyao Wu2026-03-10💻 cs

NaviDriveVLM: Decoupling High-Level Reasoning and Motion Planning for Autonomous Driving

El artículo presenta NaviDriveVLM, un marco decoupled que separa el razonamiento de alto nivel de la planificación de movimiento mediante un Navegador a gran escala y un Controlador ligero, logrando una planificación de movimiento superior en el benchmark nuScenes al preservar la capacidad de razonamiento y reducir los costos de entrenamiento.

Ximeng Tao, Pardis Taghavi, Dimitar Filev, Reza Langari, Gaurav Pandey2026-03-10🤖 cs.LG

DyQ-VLA: Temporal-Dynamic-Aware Quantization for Embodied Vision-Language-Action Models

El artículo presenta DyQ-VLA, un marco de cuantización dinámica para modelos de Visión-Lenguaje-Acción que, al aprovechar la sensibilidad temporal y los indicadores cinemáticos en tiempo real, reduce la huella de memoria en un 69,1% y acelera la ejecución sin comprometer el rendimiento.

Zihao Zheng, Hangyu Cao, Sicheng Tian, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Zhaobo Zhang, Xuanzhe Liu, Donggang Cao, Hong Mei, Xiang Chen2026-03-10🤖 cs.LG

Long-Short Term Agents for Pure-Vision Bronchoscopy Robotic Autonomy

Este artículo presenta un marco de autonomía puramente visual para la navegación broncoscópica asistida por robots que, mediante agentes jerárquicos de corto y largo plazo y un crítico de modelo del mundo, logra una navegación precisa sin sensores externos, demostrando su viabilidad preclínica en modelos in vitro e in vivo.

Junyang Wu, Mingyi Luo, Fangfang Xie, Minghui Zhang, Hanxiao Zhang, Chunxi Zhang, Junhao Wang, Jiayuan Sun, Yun Gu, Guang-Zhong Yang2026-03-10💻 cs

Unified Structural-Hydrodynamic Modeling of Underwater Underactuated Mechanisms and Soft Robots

Este trabajo propone un marco de optimización global impulsado por trayectorias, inspirado en CMA-ES, que permite la identificación unificada y precisa de parámetros estructurales e hidrodinámicos acoplados para modelar con alta fidelidad mecanismos subactuados y robots blandos submarinos, demostrando su escalabilidad y transferibilidad desde mecanismos de múltiples cuerpos hasta brazos blandos inspirados en pulpos y robots completos.

Chenrui Zhang, Yiyuan Zhang, Yunfei Ye, Junkai Chen, Haozhe Wang, Cecilia Laschi2026-03-10🔬 physics

RAPID: Redundancy-Aware and Compatibility-Optimal Edge-Cloud Partitioned Inference for Diverse VLA models

El artículo presenta RAPID, un nuevo marco de inferencia colaborativa borde-nube para modelos de Visión-Lenguaje-Acción que mitiga la interferencia del ruido visual y preserva la continuidad física de los movimientos mediante la detección de redundancia, logrando una aceleración de hasta 1.73x con un sobrecosto mínimo.

Zihao Zheng, Sicheng Tian, Hangyu Cao, Chenyue Li, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Guojie Luo, Xiang Chen2026-03-10💻 cs