cs.RO artículos | Gist.Science

Control Lyapunov Functions for Underactuated Soft Robots

Este artículo presenta un marco de control general que utiliza funciones de Lyapunov de control estabilizadoras exponencialmente rápidas como restricciones convexas para lograr una regulación y seguimiento precisos en robots blandos subactuados bajo límites de actuadores, superando a los métodos existentes en simulaciones.

Huy Pham, Zach J. Patterson2026-03-09💻 cs

RFM-HRI : A Multimodal Dataset of Medical Robot Failure, User Reaction and Recovery Preferences for Item Retrieval Tasks

Este trabajo presenta el conjunto de datos multimodal RFM-HRI, que registra las reacciones verbales y no verbales de los usuarios ante fallos en robots de asistencia médica durante tareas de recuperación de objetos, analizando cómo estos incidentes afectan la confianza y las preferencias de recuperación para mejorar la seguridad en entornos críticos.

Yashika Batra, Giuliano Pioldi, Promise Ekpo, Arman Sayatqyzy, Purnjay Maruur, Shalom Otieno, Kevin Ching, Angelique Taylor2026-03-09💻 cs

Relational Semantic Reasoning on 3D Scene Graphs for Open World Interactive Object Search

El artículo presenta SCOUT, un método innovador que utiliza grafos de escena 3D y un marco de destilación procedimental para realizar búsquedas interactivas de objetos en entornos abiertos de manera eficiente, superando las limitaciones de los métodos basados en similitud de embeddings y los modelos de lenguaje grandes en términos de velocidad y costo.

Imen Mahdi, Matteo Cassinelli, Fabien Despinoy, Tim Welschehold, Abhinav Valada2026-03-09🤖 cs.AI

TransMASK: Masked State Representation through Learned Transformation

El artículo presenta TransMASK, un método auto-supervisado que aprende una máscara para transformar los estados observados en representaciones latentes que destacan los elementos relevantes e ignoran los irrelevantes, mejorando así la generalización y robustez de las políticas de aprendizaje por imitación en robots sin necesidad de etiquetas adicionales.

Sagar Parekh, Preston Culbertson, Dylan P. Losey2026-03-09💻 cs

Contact-Grounded Policy: Dexterous Visuotactile Policy with Generative Contact Grounding

El artículo presenta la Política Anclada al Contacto (CGP), un enfoque que permite la manipulación hábil y rica en contactos mediante la predicción del estado del robot y el feedback táctil, utilizando un mapeo de consistencia aprendido para convertir estas predicciones en objetivos ejecutables para un controlador de cumplimiento.

Zhengtong Xu, Yeping Wang, Ben Abbatematteo, Jom Preechayasomboon, Sonny Chan, Nick Colonnese, Amirhossein H. Memar2026-03-09💻 cs

Introducing the transitional autonomous vehicle lane-changing dataset: Empirical Experiments

Este artículo presenta el conjunto de datos NC-tALC, una base de datos empírica de alta fidelidad que registra 152 ensayos controlados para analizar las interacciones y dinámicas de respuesta de vehículos autónomos transicionales durante maniobras de cambio de carril.

Abhinav Sharma, Zijun He, Danjue Chen2026-03-09💻 cs

Environment-Aware Path Generation for Robotic Additive Manufacturing of Structures

Este artículo presenta un marco de generación de trayectorias consciente del entorno para la fabricación aditiva robótica que permite el diseño en línea de estructuras evitando obstáculos mediante cuatro algoritmos de planificación de rutas, evaluando su rendimiento computacional y estructural en entornos desafiantes para identificar las soluciones más prometedoras.

Mahsa Rabiei, Reza Moini2026-03-09💻 cs

Vision-Language System using Open-Source LLMs for Gestures in Medical Interpreter Robots

Este artículo presenta un sistema de visión y lenguaje basado en modelos de código abierto y desplegado localmente para robots intérpretes médicos, que detecta actos de habla en conversaciones clínicas y genera gestos robóticos, logrando una alta precisión y superando a las líneas base en naturalidad humana.

Thanh-Tung Ngo, Emma Murphy, Robert J. Ross2026-03-09💻 cs

Safe-Night VLA: Seeing the Unseen via Thermal-Perceptive Vision-Language-Action Models for Safety-Critical Manipulation

El artículo presenta Safe-Night VLA, un marco multimodal que integra percepción térmica infrarroja y filtros de seguridad basados en funciones de barrera para permitir a los robots manipular objetos de forma segura en entornos no estructurados, superando las limitaciones de los modelos de visión-acción basados únicamente en RGB.

Dian Yu, Qingchuan Zhou, Bingkun Huang, Majid Khadiv, Zewen Yang2026-03-09💻 cs

EmboAlign: Aligning Video Generation with Compositional Constraints for Zero-Shot Manipulation

El método EmboAlign presenta un marco sin datos que alinea los modelos generativos de video con restricciones composicionales extraídas por modelos de lenguaje-visión para seleccionar trayectorias físicamente plausibles y optimizarlas, mejorando significativamente la tasa de éxito en tareas de manipulación robótica sin entrenamiento específico.

Gehao Zhang, Zhenyang Ni, Payal Mohapatra, Han Liu, Ruohan Zhang, Qi Zhu2026-03-09💻 cs

Multi-Robot Trajectory Planning via Constrained Bayesian Optimization and Local Cost Map Learning with STL-Based Conflict Resolution

Este artículo presenta un marco de dos etapas que integra la optimización bayesiana restringida con el razonamiento de Lógica Temporal de Señales (STL) para planificar trayectorias multi-robot eficientes y seguras bajo restricciones cinodinámicas, validando su robustez mediante experimentos reales con vehículos autónomos.

Sourav Raxit, Abdullah Al Redwan Newaz, Jose Fuentes, Paulo Padrao, Ana Cavalcanti, Leonardo Bobadilla2026-03-09💻 cs

Task-Level Decisions to Gait Level Control: A Hierarchical Policy Approach for Quadruped Navigation

El artículo presenta TDGC, una arquitectura de política jerárquica para la navegación de cuadrúpedos que aborda la desconexión entre la toma de decisiones de alto nivel y el control de la marcha mediante un enfoque modular entrenado por refuerzo, logrando una mayor robustez y tasas de éxito en terrenos mixtos y fuera de distribución.

Sijia Li, Haoyu Wang, Shenghai Yuan, Yizhuo Yang, Thien-Minh Nguyen2026-03-09💻 cs

CDF-Glove: A Cable-Driven Force Feedback Glove for Dexterous Teleoperation

El artículo presenta el CDF-Glove, un guante de retroalimentación de fuerza accionado por cables de bajo costo y ligero que mejora significativamente la calidad de las demostraciones teleoperadas y el rendimiento de la imitación de aprendizaje en la manipulación diestra.

Huayue Liang, Ruochong Li, Yaodong Yang, Long Zeng, Yuanpei Chen, Xueqian Wang2026-03-09💻 cs

Hierarchical Latent Action Model

El artículo presenta HiLAM, un modelo de acción latente jerárquico que descubre habilidades latentes de alto nivel modelando información temporal a largo plazo en videos sin acciones, utilizando un LAM preentrenado como extractor de bajo nivel para superar las limitaciones de los modelos existentes centrados en transiciones de corto alcance.

Hanjung Kim, Lerrel Pinto, Seon Joo Kim2026-03-09💻 cs

OpenHEART: Opening Heterogeneous Articulated Objects with a Legged Manipulator

Este artículo presenta OpenHEART, un marco robusto y eficiente en muestras que utiliza la extracción de características abstractas (SAFE) y un estimador de información de articulación (ArtIEst) para permitir que manipuladores con patas abran de forma generalizada objetos articulados heterogéneos como puertas y cajones.

Seonghyeon Lim, Hyeonwoo Lee, Seunghyun Lee, I Made Aswin Nahrendra, Hyun Myung2026-03-09💻 cs

Terrain characterization and locomotion adaptation in a small-scale lizard-inspired robot

Este artículo presenta al SILA Bot, un robot pequeño inspirado en lagartos que utiliza señales propioceptivas y un controlador de retroalimentación lineal para estimar la profundidad del sustrato y adaptar su patrón de movimiento, logrando así una locomoción efectiva en terrenos complejos con baja complejidad computacional.

Duncan Andrews, Landon Zimmerman, Evan Martin, Joe DiGennaro, Baxi Chong2026-03-09💻 cs

Expert Knowledge-driven Reinforcement Learning for Autonomous Racing via Trajectory Guidance and Dynamics Constraints

Este artículo propone un método de aprendizaje por refuerzo llamado TraD-RL que integra líneas de carrera expertas y restricciones de dinámica vehicular mediante funciones de barrera de control para lograr un aprendizaje seguro y estable que supera el rendimiento de expertos en entornos de carreras autónomas de alta dinámica.

Bo Leng, Weiqi Zhang, Zhuoren Li, Lu Xiong, Guizhe Jin, Ran Yu, Chen Lv2026-03-09💻 cs

DexEMG: Towards Dexterous Teleoperation System via EMG2Pose Generalization

El artículo presenta DexEMG, un sistema de teleoperación ligero y rentable que utiliza señales electromiográficas superficiales y una red neuronal llamada EMG2Pose para controlar manos robóticas dexteras con alta precisión y generalización, eliminando la necesidad de recalibración intensiva.

Qianyou Zhao, Wenqiao Li, Chiyu Wang, Kaifeng Zhang2026-03-09💻 cs

AnyCamVLA: Zero-Shot Camera Adaptation for Viewpoint Robust Vision-Language-Action Models

El artículo presenta AnyCamVLA, un marco de adaptación de cámara en tiempo real y sin disparos que utiliza síntesis de vistas novedosas para ajustar las observaciones visuales durante la prueba, permitiendo que los modelos de Visión-Lenguaje-Acción preentrenados mantengan su robustez ante cambios de perspectiva sin necesidad de datos adicionales, ajuste fino o modificaciones arquitectónicas.

Hyeongjun Heo, Seungyeon Woo, Sang Min Kim, Junho Kim, Junho Lee, Yonghyeon Lee, Young Min Kim2026-03-09💻 cs

Systematic Evaluation of Novel View Synthesis for Video Place Recognition

Este artículo presenta una evaluación sistemática de la síntesis de nuevas vistas en el reconocimiento de lugares en video, demostrando que las vistas sintéticas mejoran las estadísticas de reconocimiento, especialmente cuando se añaden en gran número, independientemente de la magnitud del cambio de perspectiva.

Muhammad Zawad Mahmud, Samiha Islam, Damian Lyons2026-03-09💻 cs

← Anterior Siguiente →