cs.RO artículos | Gist.Science

On the Strengths and Weaknesses of Data for Open-set Embodied Assistance

Este artículo investiga las fortalezas y debilidades de los datos para la asistencia abierta en entornos corporificados, demostrando mediante un modelo multimodal fine-tuned en el dominio sintético de Overcooked que la generalización efectiva a comportamientos y configuraciones no vistos requiere conjuntos de datos diversos que abarquen la fundamentación multimodal, la inferencia de defectos y la exposición a múltiples escenarios.

Pradyumna Tambwekar, Andrew Silva, Deepak Gopinath + 3 more2026-03-06🤖 cs.AI

Task-Relevant and Irrelevant Region-Aware Augmentation for Generalizable Vision-Based Imitation Learning in Agricultural Manipulation

Este artículo presenta DRAIL, un marco de aumento de datos que mejora la generalización del aprendizaje por imitación en manipulación agrícola al distinguir y procesar de manera diferenciada las regiones visuales relevantes para la tarea y las irrelevantes, logrando así políticas más robustas frente a variaciones en el entorno.

Shun Hattori, Hikaru Sasaki, Takumi Hachimine + 2 more2026-03-06💻 cs

Hyperbolic Multiview Pretraining for Robotic Manipulation

El artículo presenta HyperMVP, un marco de preentrenamiento auto-supervisado en espacio hiperbólico que, junto con el nuevo dataset 3D-MOV, supera a los métodos basados en espacios euclidianos para lograr políticas de manipulación robótica más robustas y generalizables.

Jin Yang, Ping Wei, Yixin Chen2026-03-06💻 cs

Causally Robust Reward Learning from Reason-Augmented Preference Feedback

El artículo presenta ReCouPLe, un marco ligero que utiliza razonamientos en lenguaje natural para aprender recompensas robustas y causalmente consistentes a partir de preferencias, permitiendo la transferencia de conocimiento a nuevas tareas y superando a los métodos existentes en precisión y rendimiento bajo cambios de distribución.

Minjune Hwang, Yigit Korkmaz, Daniel Seita + 1 more2026-03-06🤖 cs.AI

VPWEM: Non-Markovian Visuomotor Policy with Working and Episodic Memory

El artículo presenta VPWEM, una política visuomotor no markoviana que integra memorias de trabajo y episódica mediante un compresor contextual basado en Transformers para resolver tareas de manipulación que requieren memoria a largo plazo con una eficiencia computacional constante, superando significativamente a los modelos de estado del arte en benchmarks de manipulación móvil y de memoria intensiva.

Yuheng Lei, Zhixuan Liang, Hongyuan Zhang + 1 more2026-03-06🤖 cs.AI

Beyond the Patch: Exploring Vulnerabilities of Visuomotor Policies via Viewpoint-Consistent 3D Adversarial Object

Este trabajo propone un método de optimización de texturas adversarias para objetos 3D que, mediante renderizado diferenciable y estrategias como la expectativa sobre transformaciones y un currículo de lo grueso a lo fino, supera las limitaciones de los parches 2D al mantener su eficacia contra políticas visuomotoras bajo vistas dinámicas y distancias variables.

Chanmi Lee, Minsung Yoon, Woojae Kim + 2 more2026-03-06💻 cs

U-OBCA: Uncertainty-Aware Optimization-Based Collision Avoidance via Wasserstein Distributionally Robust Chance Constraints

El artículo presenta U-OBCA, un marco de planificación de trayectorias que utiliza restricciones de probabilidad distribucionalmente robustas basadas en Wasserstein para manejar incertidumbres en robots poligonales, logrando así una navegación más eficiente y menos conservadora en entornos estrechos en comparación con los métodos existentes.

Zehao Wang, Yuxuan Tang, Han Zhang + 2 more2026-03-06🔢 math

Integrated cooperative localization of heterogeneous measurement swarm: A unified data-driven method

Este trabajo propone un método unificado basado en datos para la localización cooperativa de enjambres robóticos heterogéneos, que supera las limitaciones de las topologías de medición dirigidas y dispersas mediante un estimador adaptativo de localización relativa y una estrategia de acoplamiento de pose distribuida, garantizando la convergencia bajo condiciones topológicas mínimas.

Kunrui Ze, Wei Wang, Guibin Sun + 3 more2026-03-06💻 cs

Person Detection and Tracking from an Overhead Crane LiDAR

Este artículo presenta un conjunto de datos específico y la adaptación de detectores 3D para la detección y seguimiento de personas desde la perspectiva de una grúa aérea con LiDAR, logrando alta precisión en un entorno industrial y cerrando la brecha de dominio con los conjuntos de datos de conducción estándar.

Nilusha Jayawickrama, Henrik Toikka, Risto Ojala2026-03-06🤖 cs.LG

Observer Design for Augmented Reality-based Teleoperation of Soft Robots

Este artículo presenta un sistema de teleoperación basado en realidad aumentada con HoloLens 2 para robots blandos, validado en el manipulador neumático PETER, que logra estimar la posición del robot con un error del 5% de su longitud, demostrando la viabilidad de integrar esta interfaz en el bucle de control a pesar de las dificultades de modelado.

Jorge Francisco García-Samartín, Iago López Pérez, Emirhan Yolcu + 2 more2026-03-06💻 cs

Direct Contact-Tolerant Motion Planning With Vision Language Models

Este artículo presenta un planificador de movimiento de contacto directo (DCT) que integra modelos de visión y lenguaje para generar nubes de puntos conscientes del contacto y optimizar la navegación, permitiendo a los robots moverse de manera eficiente y robusta en entornos abarrotados con obstáculos móviles o deformables.

He Li, Jian Sun, Chengyang Li + 4 more2026-03-06💻 cs

CoIn3D: Revisiting Configuration-Invariant Multi-Camera 3D Object Detection

El paper presenta CoIn3D, un marco generalizable para la detección 3D de objetos con múltiples cámaras que supera las limitaciones de generalización en configuraciones no vistas al integrar explícitamente priores espaciales mediante modulación de características sensible al espacio y aumento de datos consciente de la cámara.

Zhaonian Kuang, Rui Ding, Haotian Wang + 3 more2026-03-06💻 cs

VinePT-Map: Pole-Trunk Semantic Mapping for Resilient Autonomous Robotics in Vineyards

Este artículo presenta VinePT-Map, un marco de mapeo semántico que utiliza troncos de vid y postes de soporte como hitos estructurales persistentes para lograr una localización robusta y agnóstica a las estaciones en robots autónomos dentro de viñedos, validado mediante un nuevo conjunto de datos multitemporal y experimentos de campo.

Giorgio Audrito, Mauro Martini, Alessandro Navone + 2 more2026-03-06💻 cs

AIM-SLAM: Dense Monocular SLAM via Adaptive and Informative Multi-View Keyframe Prioritization with Foundation Model

El artículo presenta AIM-SLAM, un marco de SLAM monocular denso que utiliza modelos fundacionales geométricos y un módulo SIGMA para priorizar adaptativamente múltiples vistas clave, logrando un rendimiento superior en estimación de poses y reconstrucción densa mediante una optimización conjunta Sim(3).

Jinwoo Jeon, Dong-Uk Seo, Eungchang Mason Lee + 1 more2026-03-06💻 cs

GaussTwin: Unified Simulation and Correction with Gaussian Splatting for Robotic Digital Twins

El artículo presenta GaussTwin, un gemelo digital en tiempo real que integra dinámica basada en posiciones, formulaciones de varillas de Cosserat y splatting gaussiano para cerrar la brecha entre simulación y realidad, mejorando significativamente la precisión del seguimiento y la planificación robótica en comparación con métodos existentes.

Yichen Cai, Paul Jansonnie, Cristiana de Farias + 2 more2026-03-06💻 cs

SPIRIT: Perceptive Shared Autonomy for Robust Robotic Manipulation under Deep Learning Uncertainty

El sistema SPIRIT propone una autonomía compartida perceptiva que regula el nivel de control entre la manipulación semiautónoma y la teleoperación háptica basándose en estimaciones de incertidumbre de aprendizaje profundo, logrando así una manipulación robótica robusta y segura incluso ante fallos en la percepción.

Jongseok Lee, Ribin Balachandran, Harsimran Singh + 6 more2026-03-06🤖 cs.AI

Decoupling Task and Behavior: A Two-Stage Reward Curriculum in Reinforcement Learning for Robotics

Este artículo propone un currículo de recompensa de dos etapas que desacopla los objetivos específicos de la tarea de los términos conductuales para mejorar la exploración y la estabilidad en el aprendizaje por refuerzo robótico, demostrando un rendimiento superior y mayor robustez frente a las ponderaciones de recompensa en comparación con los métodos baselines.

Kilian Freitag, Knut Åkesson, Morteza Haghir Chehreghani2026-03-06🤖 cs.LG

SeedPolicy: Horizon Scaling via Self-Evolving Diffusion Policy for Robot Manipulation

El artículo presenta SeedPolicy, un método de aprendizaje por imitación que integra el módulo de atención gateada autoevolutiva (SEGA) en políticas de difusión para superar las limitaciones de escalabilidad temporal, logrando un rendimiento superior y una mayor eficiencia en tareas de manipulación robótica a largo plazo en comparación con modelos existentes.

Youqiang Gui, Yuxuan Zhou, Shen Cheng + 4 more2026-03-06💻 cs

Act, Think or Abstain: Complexity-Aware Adaptive Inference for Vision-Language-Action Models

Este artículo propone un marco de inferencia adaptativa para modelos de visión-lenguaje-acción que, inspirado en la cognición humana, clasifica dinámicamente la complejidad de la tarea mediante un detector basado en visión para decidir cuándo actuar, razonar o abstenerse, logrando así una asignación eficiente de recursos y una mayor seguridad operativa.

Riccardo Andrea Izzo, Gianluca Bardaro, Matteo Matteucci2026-03-06💻 cs

Lifelong Language-Conditioned Robotic Manipulation Learning

Este artículo presenta SkillsCrafter, un marco novedoso para el aprendizaje continuo de manipulación robótica que mitiga el olvido catastrófico mediante la adaptación de habilidades y la agregación de especialización, permitiendo la adquisición dinámica de nuevas destrezas sin perder las anteriores.

Xudong Wang, Zebin Han, Zhiyu Liu + 5 more2026-03-06🤖 cs.AI

← Anterior Siguiente →