CBF-RL: Safety Filtering Reinforcement Learning in Training with Control Barrier Functions

Este artículo presenta CBF-RL, un marco que integra Funciones de Barrera de Control (CBF) directamente en el entrenamiento de aprendizaje por refuerzo para internalizar restricciones de seguridad en la política aprendida, permitiendo un despliegue seguro y robusto en robots reales sin necesidad de filtros de seguridad en tiempo de ejecución.

Lizhi Yang, Blake Werner, Massimiliano de Sa + 1 more2026-03-06💻 cs

ROVER: Regulator-Driven Robust Temporal Verification of Black-Box Robot Policies

El artículo presenta ROVER, un enfoque novedoso impulsado por reguladores que verifica y mejora iterativamente políticas de robots de caja negra mediante la evaluación de trazas de ejecución frente a requisitos de seguridad temporal expresados en Lógica Temporal de Señales (STL), logrando mejoras significativas en el cumplimiento de normas y la suavidad de navegación tanto en simulaciones como en robots físicos reales.

Kristy Sakano, Jianyu An, Dinesh Manocha + 1 more2026-03-06💻 cs

Observer-Actor: Active Vision Imitation Learning with Sparse-View Gaussian Splatting

El artículo presenta ObAct, un marco novedoso de aprendizaje por imitación con visión activa que utiliza un sistema robótico de doble brazo con cámaras en la muñeca para construir dinámicamente una representación 3DGS, explorar virtualmente y mover el brazo observador a la posición óptima, logrando así políticas más robustas y eficaces que superan significativamente a los enfoques con cámaras estáticas.

Yilong Wang, Cheng Qian, Ruomeng Fan + 1 more2026-03-06💻 cs

MarketGen: A Scalable Simulation Platform with Auto-Generated Embodied Supermarket Environments

MarketGen es una plataforma de simulación escalable que utiliza generación procedural basada en agentes para crear automáticamente entornos de supermercado realistas y diversos, abordando la falta de datos en entornos comerciales complejos mediante un nuevo benchmark con tareas de manipulación móvil y de larga duración validado con transferencia sim2real.

Xu Hu, Yiyang Feng, Junran Peng + 7 more2026-03-06💻 cs

GRAND: Guidance, Rebalancing, and Assignment for Networked Dispatch in Multi-Agent Path Finding

El artículo presenta GRAND, un algoritmo híbrido que combina una política de redes neuronales gráficas entrenada por aprendizaje por refuerzo con optimización de flujo mínimo y asignación local para mejorar el rendimiento y reducir la congestión en la programación de flotas de robots en almacenes, superando a los métodos actuales en benchmarks de gran escala.

Johannes Gaber, Meshal Alharbi, Daniele Gammelli + 1 more2026-03-06💻 cs

Towards Exploratory and Focused Manipulation with Bimanual Active Perception: A New Problem, Benchmark and Strategy

Este trabajo presenta el nuevo problema de Manipulación Exploratoria y Enfocada (EFM), junto con el benchmark EFM-10 y la estrategia de Percepción Activa Bimanual (BAP), para abordar la falta de información visual en tareas de manipulación complejas mediante la recolección activa de datos y el aprendizaje por imitación.

Yuxin He, Ruihao Zhang, Tianao Shen + 2 more2026-03-06💻 cs

Viewpoint Matters: Dynamically Optimizing Viewpoints with Masked Autoencoder for Visual Manipulation

El artículo presenta MAE-Select, un marco novedoso que optimiza dinámicamente la selección de puntos de vista en sistemas robóticos de cámara única mediante representaciones de autoencoders enmascarados preentrenados, superando las limitaciones de las configuraciones fijas y, en algunos casos, igualando o excediendo el rendimiento de los sistemas multicámara.

Pengfei Yi, Yifan Han, Junyan Li + 2 more2026-03-06💻 cs