On the Strengths and Weaknesses of Data for Open-set Embodied Assistance

Este artículo investiga las fortalezas y debilidades de los datos para la asistencia abierta en entornos corporificados, demostrando mediante un modelo multimodal fine-tuned en el dominio sintético de Overcooked que la generalización efectiva a comportamientos y configuraciones no vistos requiere conjuntos de datos diversos que abarquen la fundamentación multimodal, la inferencia de defectos y la exposición a múltiples escenarios.

Pradyumna Tambwekar, Andrew Silva, Deepak Gopinath + 3 more2026-03-06🤖 cs.AI

Task-Relevant and Irrelevant Region-Aware Augmentation for Generalizable Vision-Based Imitation Learning in Agricultural Manipulation

Este artículo presenta DRAIL, un marco de aumento de datos que mejora la generalización del aprendizaje por imitación en manipulación agrícola al distinguir y procesar de manera diferenciada las regiones visuales relevantes para la tarea y las irrelevantes, logrando así políticas más robustas frente a variaciones en el entorno.

Shun Hattori, Hikaru Sasaki, Takumi Hachimine + 2 more2026-03-06💻 cs

VPWEM: Non-Markovian Visuomotor Policy with Working and Episodic Memory

El artículo presenta VPWEM, una política visuomotor no markoviana que integra memorias de trabajo y episódica mediante un compresor contextual basado en Transformers para resolver tareas de manipulación que requieren memoria a largo plazo con una eficiencia computacional constante, superando significativamente a los modelos de estado del arte en benchmarks de manipulación móvil y de memoria intensiva.

Yuheng Lei, Zhixuan Liang, Hongyuan Zhang + 1 more2026-03-06🤖 cs.AI

Beyond the Patch: Exploring Vulnerabilities of Visuomotor Policies via Viewpoint-Consistent 3D Adversarial Object

Este trabajo propone un método de optimización de texturas adversarias para objetos 3D que, mediante renderizado diferenciable y estrategias como la expectativa sobre transformaciones y un currículo de lo grueso a lo fino, supera las limitaciones de los parches 2D al mantener su eficacia contra políticas visuomotoras bajo vistas dinámicas y distancias variables.

Chanmi Lee, Minsung Yoon, Woojae Kim + 2 more2026-03-06💻 cs

U-OBCA: Uncertainty-Aware Optimization-Based Collision Avoidance via Wasserstein Distributionally Robust Chance Constraints

El artículo presenta U-OBCA, un marco de planificación de trayectorias que utiliza restricciones de probabilidad distribucionalmente robustas basadas en Wasserstein para manejar incertidumbres en robots poligonales, logrando así una navegación más eficiente y menos conservadora en entornos estrechos en comparación con los métodos existentes.

Zehao Wang, Yuxuan Tang, Han Zhang + 2 more2026-03-06🔢 math

Integrated cooperative localization of heterogeneous measurement swarm: A unified data-driven method

Este trabajo propone un método unificado basado en datos para la localización cooperativa de enjambres robóticos heterogéneos, que supera las limitaciones de las topologías de medición dirigidas y dispersas mediante un estimador adaptativo de localización relativa y una estrategia de acoplamiento de pose distribuida, garantizando la convergencia bajo condiciones topológicas mínimas.

Kunrui Ze, Wei Wang, Guibin Sun + 3 more2026-03-06💻 cs

Observer Design for Augmented Reality-based Teleoperation of Soft Robots

Este artículo presenta un sistema de teleoperación basado en realidad aumentada con HoloLens 2 para robots blandos, validado en el manipulador neumático PETER, que logra estimar la posición del robot con un error del 5% de su longitud, demostrando la viabilidad de integrar esta interfaz en el bucle de control a pesar de las dificultades de modelado.

Jorge Francisco García-Samartín, Iago López Pérez, Emirhan Yolcu + 2 more2026-03-06💻 cs

VinePT-Map: Pole-Trunk Semantic Mapping for Resilient Autonomous Robotics in Vineyards

Este artículo presenta VinePT-Map, un marco de mapeo semántico que utiliza troncos de vid y postes de soporte como hitos estructurales persistentes para lograr una localización robusta y agnóstica a las estaciones en robots autónomos dentro de viñedos, validado mediante un nuevo conjunto de datos multitemporal y experimentos de campo.

Giorgio Audrito, Mauro Martini, Alessandro Navone + 2 more2026-03-06💻 cs

GaussTwin: Unified Simulation and Correction with Gaussian Splatting for Robotic Digital Twins

El artículo presenta GaussTwin, un gemelo digital en tiempo real que integra dinámica basada en posiciones, formulaciones de varillas de Cosserat y splatting gaussiano para cerrar la brecha entre simulación y realidad, mejorando significativamente la precisión del seguimiento y la planificación robótica en comparación con métodos existentes.

Yichen Cai, Paul Jansonnie, Cristiana de Farias + 2 more2026-03-06💻 cs

SPIRIT: Perceptive Shared Autonomy for Robust Robotic Manipulation under Deep Learning Uncertainty

El sistema SPIRIT propone una autonomía compartida perceptiva que regula el nivel de control entre la manipulación semiautónoma y la teleoperación háptica basándose en estimaciones de incertidumbre de aprendizaje profundo, logrando así una manipulación robótica robusta y segura incluso ante fallos en la percepción.

Jongseok Lee, Ribin Balachandran, Harsimran Singh + 6 more2026-03-06🤖 cs.AI

Decoupling Task and Behavior: A Two-Stage Reward Curriculum in Reinforcement Learning for Robotics

Este artículo propone un currículo de recompensa de dos etapas que desacopla los objetivos específicos de la tarea de los términos conductuales para mejorar la exploración y la estabilidad en el aprendizaje por refuerzo robótico, demostrando un rendimiento superior y mayor robustez frente a las ponderaciones de recompensa en comparación con los métodos baselines.

Kilian Freitag, Knut Åkesson, Morteza Haghir Chehreghani2026-03-06🤖 cs.LG

SeedPolicy: Horizon Scaling via Self-Evolving Diffusion Policy for Robot Manipulation

El artículo presenta SeedPolicy, un método de aprendizaje por imitación que integra el módulo de atención gateada autoevolutiva (SEGA) en políticas de difusión para superar las limitaciones de escalabilidad temporal, logrando un rendimiento superior y una mayor eficiencia en tareas de manipulación robótica a largo plazo en comparación con modelos existentes.

Youqiang Gui, Yuxuan Zhou, Shen Cheng + 4 more2026-03-06💻 cs

Act, Think or Abstain: Complexity-Aware Adaptive Inference for Vision-Language-Action Models

Este artículo propone un marco de inferencia adaptativa para modelos de visión-lenguaje-acción que, inspirado en la cognición humana, clasifica dinámicamente la complejidad de la tarea mediante un detector basado en visión para decidir cuándo actuar, razonar o abstenerse, logrando así una asignación eficiente de recursos y una mayor seguridad operativa.

Riccardo Andrea Izzo, Gianluca Bardaro, Matteo Matteucci2026-03-06💻 cs