From Local Corrections to Generalized Skills: Improving Neuro-Symbolic Policies with MEMO

El artículo presenta MEMO, un enfoque que mejora las políticas de manipulación neuro-simbólicas agregando correcciones de retroalimentación humana local en una biblioteca de habilidades recuperable para sintetizar guías de texto y plantillas de código generalizadas que permiten al robot adaptarse a tareas novedosas.

Benjamin A. Christie, Yinlong Dai, Mohammad Bararjanianbahnamiri + 2 more2026-03-06💻 cs

Distributed State Estimation for Vision-Based Cooperative Slung Load Transportation in GPS-Denied Environments

Este artículo presenta un marco de estimación de estado distribuido y descentralizado basado en visión para el transporte cooperativo de cargas suspendidas mediante múltiples UAVs en entornos sin GPS, el cual fusiona mediciones de cámaras monocular mediante un filtro de información extendido para lograr un control robusto y escalable incluso ante pérdidas de sensores o comunicación.

Jack R. Pence, Jackson Fezell, Jack W. Langelaan + 1 more2026-03-06💻 cs

ELLIPSE: Evidential Learning for Robust Waypoints and Uncertainties

El artículo presenta ELLIPSE, un método de aprendizaje evidencial que genera waypoints y distribuciones de incertidumbre robustas para robots móviles mediante aumentación de dominio ligera y recalibración isotónica, demostrando mejoras significativas en la tasa de éxito y la cobertura de incertidumbre en escenarios críticos como la predicción de waypoints en escaleras.

Zihao Dong, Chanyoung Chung, Dong-Ki Kim + 5 more2026-03-06💻 cs

Autonomous Aerial Non-Destructive Testing: Ultrasound Inspection with a Commercial Quadrotor in an Unstructured Environment

Este trabajo presenta un sistema de control y software integrado que permite la inspección no destructiva por ultrasonidos totalmente autónoma y en contacto con un dron comercial Flyability Elios 3 en entornos industriales no estructurados, validando la viabilidad de adaptar plataformas comerciales para tareas de inspección física segura.

Ruben Veenstra, Barbara Bazzana, Sander Smits + 1 more2026-03-06💻 cs

Python Bindings for a Large C++ Robotics Library: The Case of OMPL

Este trabajo presenta un flujo de trabajo que combina la asistencia de modelos de lenguaje grandes (LLM) con la supervisión humana para generar automáticamente y de manera eficiente los bindings de Python para la gran biblioteca de robótica OMPL, logrando un rendimiento comparable al de las soluciones tradicionales mientras se mitigan errores comunes mediante un diseño cuidadoso de los prompts.

Weihang Guo, Theodoros Tyrovouzis, Lydia E. Kavraki2026-03-06💻 cs

Selecting Spots by Explicitly Predicting Intention from Motion History Improves Performance in Autonomous Parking

Este trabajo propone una nueva metodología para el estacionamiento autónomo que mejora el rendimiento al seleccionar plazas basándose en la predicción explícita de las intenciones de otros vehículos a partir de su historial de movimiento, superando así a enfoques existentes que dependen de predicciones de movimiento a corto plazo o modelos implícitos.

Long Kiu Chung, David Isele, Faizan M. Tariq + 3 more2026-03-06💻 cs

LEGS-POMDP: Language and Gesture-Guided Object Search in Partially Observable Environments

El artículo presenta LEGS-POMDP, un sistema modular basado en procesos de decisión de Markov parciales que integra lenguaje, gestos y observaciones visuales para permitir que los robots busquen objetos en entornos abiertos y parcialmente observables, logrando una alta tasa de éxito al modelar explícitamente la incertidumbre sobre la identidad y la ubicación del objetivo.

Ivy Xiao He, Stefanie Tellex, Jason Xinyu Liu2026-03-06💻 cs

Design, Mapping, and Contact Anticipation with 3D-printed Whole-Body Tactile and Proximity Sensors

Este artículo presenta GenTact-Prox, una piel artificial totalmente impresa en 3D que integra sensores táctiles y de proximidad para la anticipación de contactos, la cual es modular, adaptable a cualquier morfología robótica y se utiliza junto con un marco de datos para mapear el espacio perisensorial y permitir operaciones en línea conscientes de los objetos.

Carson Kohlbrenner, Anna Soukhovei, Caleb Escobedo + 2 more2026-03-06💻 cs

LLM-Guided Decentralized Exploration with Self-Organizing Robot Teams

Este estudio propone un método de exploración descentralizado para enjambres de robots que combina algoritmos de autoorganización para la formación dinámica de equipos con una estrategia novedosa basada en modelos de lenguaje grandes (LLM) para la selección autónoma de objetivos de exploración, validando su eficacia mediante simulaciones a gran escala.

Hiroaki Kawashima, Shun Ikejima, Takeshi Takai + 2 more2026-03-06💻 cs

Data-Driven Control of a Magnetically Actuated Fish-Like Robot

Este artículo presenta un marco de control basado en datos que combina un modelo de dinámica forward entrenado con redes neuronales, un control predictivo basado en gradientes y aprendizaje por imitación para lograr una navegación precisa y en tiempo real de robots blandos con forma de pez accionados magnéticamente, superando así los desafíos de la dinámica de fluidos no lineal y la histéresis sin depender de modelos analíticos.

Akiyuki Koyama, Hiroaki Kawashima2026-03-06💻 cs

Diffusion Policy through Conditional Proximal Policy Optimization

Este trabajo propone un método eficiente para entrenar políticas de difusión en entornos de aprendizaje por refuerzo on-policy mediante la alineación de la iteración de políticas con el proceso de difusión, lo que permite calcular la probabilidad con una simple distribución gaussiana, incorporar regularización de entropía y lograr un rendimiento superior en tareas multimodales.

Ben Liu, Shunpeng Yang, Hua Chen2026-03-06💻 cs

On the Strengths and Weaknesses of Data for Open-set Embodied Assistance

Este artículo investiga las fortalezas y debilidades de los datos para la asistencia abierta en entornos corporificados, demostrando mediante un modelo multimodal fine-tuned en el dominio sintético de Overcooked que la generalización efectiva a comportamientos y configuraciones no vistos requiere conjuntos de datos diversos que abarquen la fundamentación multimodal, la inferencia de defectos y la exposición a múltiples escenarios.

Pradyumna Tambwekar, Andrew Silva, Deepak Gopinath + 3 more2026-03-06🤖 cs.AI

Task-Relevant and Irrelevant Region-Aware Augmentation for Generalizable Vision-Based Imitation Learning in Agricultural Manipulation

Este artículo presenta DRAIL, un marco de aumento de datos que mejora la generalización del aprendizaje por imitación en manipulación agrícola al distinguir y procesar de manera diferenciada las regiones visuales relevantes para la tarea y las irrelevantes, logrando así políticas más robustas frente a variaciones en el entorno.

Shun Hattori, Hikaru Sasaki, Takumi Hachimine + 2 more2026-03-06💻 cs