cs.RO artículos | Gist.Science

NaviGait: Navigating Dynamically Feasible Gait Libraries using Deep Reinforcement Learning

NaviGait es un marco jerárquico que combina la optimización de trayectorias con el aprendizaje por refuerzo para sintetizar locomoción bípeda robusta e intuitiva seleccionando y ajustando mínimamente patrones de marcha de una librería offline, lo que simplifica el diseño de recompensas y acelera el entrenamiento en comparación con métodos convencionales.

Neil Janwani, Varun Madabushi, Maegan TuckerWed, 11 Ma💻 cs

RL-100: Performant Robotic Manipulation with Real-World Reinforcement Learning

El artículo presenta RL-100, un marco de aprendizaje por refuerzo en el mundo real basado en políticas de difusión que unifica la imitación y el refuerzo para lograr un control robótico de alta frecuencia y un rendimiento del 100% en diversas tareas complejas, superando a operadores expertos y demostrando una robustez sin precedentes en despliegues reales.

Kun Lei, Huanyu Li, Dongjie Yu, Zhenyu Wei, Lingxiao Guo, Zhennan Jiang, Ziyu Wang, Shiyu Liang, Huazhe XuWed, 11 Ma🤖 cs.AI

From Spatial to Actions: Grounding Vision-Language-Action Model in Spatial Foundation Priors

El artículo presenta FALCON, un nuevo paradigma que mejora los modelos de visión-idioma-acción inyectando tokens espaciales 3D ricos derivados de modelos fundacionales en la cabeza de acción, logrando un rendimiento superior y una mayor robustez en tareas del mundo real sin comprometer el razonamiento lingüístico.

Zhengshen Zhang, Hao Li, Yalun Dai, Zhengbang Zhu, Lei Zhou, Chenchen Liu, Dong Wang, Francis E. H. Tay, Sijin Chen, Ziwei Liu, Yuxiao Liu, Xinghang Li, Pan ZhouWed, 11 Ma🤖 cs.AI

Revisiting Replanning from Scratch: Real-Time Incremental Planning with Fast Almost-Surely Asymptotically Optimal Planners

Este artículo demuestra que la planificación incremental reactiva puede resolverse de manera más eficiente mediante una serie de problemas independientes utilizando algoritmos de planificación casi-asintóticamente óptimos (ASAO), como EIT* y AORRTC, los cuales encuentran planes globales consistentes en entornos cambiantes sin necesidad de reutilizar explícitamente planes anteriores.

Mitchell E. C. Sabbadini, Andrew H. Liu, Joseph Ruan, Tyler S. Wilson, Zachary Kingston, Jonathan D. GammellWed, 11 Ma💻 cs

SynHLMA:Synthesizing Hand Language Manipulation for Articulated Object with Discrete Human Object Interaction Representation

El artículo presenta SynHLMA, un marco innovador que genera secuencias de manipulación de manos para objetos articulados a partir de instrucciones en lenguaje natural, utilizando una representación discreta de la interacción mano-objeto y un modelo de lenguaje alineado para lograr tareas de generación, predicción e interpolación con aplicaciones en robótica.

Wang zhi, Yuyan Liu, Liu Liu, Li Zhang, Ruixuan Lu, Dan GuoWed, 11 Ma🤖 cs.AI

EgoMI: Learning Active Vision and Whole-Body Manipulation from Egocentric Human Demonstrations

El artículo presenta EgoMI, un marco que supera la brecha de encarnación en el aprendizaje por imitación al capturar trayectorias sincronizadas de manos y cabeza activa de demostraciones humanas, permitiendo a robots semihumanoides replicar estrategias de fijación visual dinámica mediante una política aumentada con memoria para lograr una manipulación robusta.

Justin Yu, Yide Shentu, Di Wu, Pieter Abbeel, Ken Goldberg, Philipp WuWed, 11 Ma💻 cs

From Demonstrations to Safe Deployment: Path-Consistent Safety Filtering for Diffusion Policies

El artículo presenta PACS, un filtro de seguridad que garantiza el despliegue seguro de políticas de difusión mediante frenado consistente con la trayectoria y análisis de alcanzabilidad, preservando así el rendimiento de la tarea y superando a los métodos reactivos existentes en entornos dinámicos.

Ralf Römer, Julian Balletshofer, Jakob Thumm, Marco Pavone, Angela P. Schoellig, Matthias AlthoffWed, 11 Ma⚡ eess

Bootstrap Dynamic-Aware 3D Visual Representation for Scalable Robot Learning

El artículo presenta AFRO, un marco de aprendizaje auto-supervisado que genera representaciones 3D conscientes de la dinámica mediante un proceso difusivo y la modelación conjunta de dinámicas directas e inversas, logrando un rendimiento superior en tareas de manipulación robótica sin necesidad de supervisión de acciones o reconstrucción geométrica explícita.

Qiwei Liang, Boyang Cai, Minghao Lai, Sitong Zhuang, Tao Lin, Yan Qin, Yixuan Ye, Jiaming Liang, Renjing XuWed, 11 Ma💻 cs

UniBYD: A Unified Framework for Learning Robotic Manipulation Across Embodiments Beyond Imitation of Human Demonstrations

El artículo presenta UniBYD, un marco unificado que supera las limitaciones de la imitación humana en la manipulación robótica mediante un algoritmo de aprendizaje por refuerzo dinámico y una representación morfológica unificada, logrando un rendimiento superior al estado del arte al adaptar las políticas a las características físicas específicas de diversos robots.

Tingyu Yuan, Biaoliang Guan, Wen Ye, Ziyan Tian, Yi Yang, Weijie Zhou, Zhaowen Li, Yan Huang, Peng Wang, Chaoyang Zhao, Jinqiao WangWed, 11 Ma💻 cs

Relative Localization System Design for SnailBot: A Modular Self-reconfigurable Robot

Este artículo presenta el diseño e implementación de un sistema de localización relativa modular para el robot SnailBot, que fusiona la detección de marcadores ArUco, el flujo óptico y los datos de la IMU para lograr un posicionamiento preciso y robusto en tiempo real para tareas colaborativas.

Shuhan Zhang, Tin Lun LamWed, 11 Ma⚡ eess

Magnetically Driven Elastic Microswimmers: Exploiting Hysteretic Collapse for Autonomous Propulsion and Independent Control

Este artículo presenta un microflotador elástico de tres esferas impulsado magnéticamente que logra una propulsión neta y un control independiente mediante el colapso histérico no recíproco inducido por campos oscilantes, optimizado para aplicaciones médicas mínimamente invasivas.

Theo Lequy, Andreas M. MenzelWed, 11 Ma🔬 physics.app-ph

A 26-Gram Butterfly-Inspired Robot Achieving Autonomous Tailless Flight

El artículo presenta a *AirPulse*, un robot autónomo de 26 gramos inspirado en mariposas que logra por primera vez un vuelo controlado y cerrado en una plataforma alada sin cola, replicando las complejas ondulaciones corporales biológicas mediante un diseño de alas flexibles y una arquitectura de control jerárquica.

Weibin Gu, Chenrui Feng, Lian Liu, Chen Yang, Xingchi Jiao, Yuhe Ding, Xiaofei Shi, Chao Gao, Alessandro Rizzo, Guyue ZhouWed, 11 Ma💻 cs

Reactive Slip Control in Multifingered Grasping: Hybrid Tactile Sensing and Internal-Force Optimization

Este trabajo presenta un enfoque híbrido que combina aprendizaje y modelos para la adaptación reactiva de fuerzas internas en agarres multifingerados, utilizando una sensorización háptica multimodal para detectar deslizamientos en ~20 ms y optimizar las fuerzas normales mediante programación cuadrática, logrando así una estabilización cerrada en menos de 50 ms.

Théo Ayral, Saifeddine Aloui, Mathieu GrossardWed, 11 Ma⚡ eess

Multimodal Adversarial Quality Policy for Safe Grasping

Este trabajo propone la Política de Calidad Adversarial Multimodal (MAQP), un marco que utiliza la optimización dual de parches heterogéneos y una estrategia de equilibrio a nivel de gradiente para generar ataques adversarios multimodales efectivos que garantizan la seguridad en el agarre guiado por visión de robots colaborativos.

Kunlin Xie, Chenghao Li, Haolan Zhang, Nak Young ChongWed, 11 Ma💻 cs

Pri4R: Learning World Dynamics for Vision-Language-Action Models with Privileged 4D Representation

El artículo presenta Pri4R, un enfoque que mejora los modelos de Visión-Lenguaje-Acción (VLA) al incorporar dinámicas del mundo mediante el aprendizaje de trayectorias de puntos 3D durante el entrenamiento, logrando así un control físico más preciso sin añadir sobrecarga computacional en la inferencia.

Jisoo Kim, Jungbin Cho, Sanghyeok Chu, Ananya Bal, Jinhyung Kim, Gunhee Lee, Sihaeng Lee, Seung Hwan Kim, Bohyung Han, Hyunmin Lee, Laszlo A. Jeni, Seungryong KimWed, 11 Ma🤖 cs.AI

SPARC: Spatial-Aware Path Planning via Attentive Robot Communication

El artículo propone SPARC, un método de planificación de trayectorias para múltiples robots que utiliza un mecanismo de atención multi-cabeza mejorado con relaciones espaciales (RMHA) para priorizar dinámicamente la comunicación entre vecinos cercanos, logrando una tasa de éxito significativamente superior en entornos congestionados y una generalización cero-shot desde 8 hasta 128 robots.

Sayang Mu, Xiangyu Wu, Bo AnWed, 11 Ma🤖 cs.AI

SPREAD: Subspace Representation Distillation for Lifelong Imitation Learning

El artículo presenta SPREAD, un marco de aprendizaje por imitación vitalicio que utiliza descomposición en valores singulares para preservar la geometría de las representaciones de tareas en subespacios de bajo rango, logrando así una transferencia de conocimiento estable y un rendimiento superior al estado del arte en el benchmark LIBERO.

Kaushik Roy, Giovanni D'urso, Nicholas Lawrance, Brendan Tidd, Peyman MoghadamWed, 11 Ma🤖 cs.LG

Age-Related Differences in the Perception of Eye-Gaze from a Social Robot

Este trabajo investiga cómo las diferencias relacionadas con la edad afectan la percepción de la mirada deíctica en la interacción humano-robot, con el objetivo de mejorar el diseño de señales no verbales adaptativas para robots sociales que asisten a adultos mayores.

Lucas Morillo-Mendez, Martien G. S. Schrooten, Oscar Martinez MozosWed, 11 Ma💻 cs

Scale-Plan: Scalable Language-Enabled Task Planning for Heterogeneous Multi-Robot Teams

El artículo presenta Scale-Plan, un marco escalable que combina modelos de lenguaje grandes con planificación simbólica para generar representaciones de problemas compactas y relevantes, superando así los desafíos de alucinación y escalabilidad en la planificación de tareas a largo plazo para equipos de robots heterogéneos.

Piyush Gupta, Sangjae Bae, Jiachen Li, David IseleWed, 11 Ma🤖 cs.AI

HMR-1: Hierarchical Massage Robot with Vision-Language-Model for Embodied Healthcare

Este artículo presenta HMR-1, un robot de masaje jerárquico que integra un modelo de lenguaje visual para la localización de acupuntos y un módulo de control de bajo nivel, respaldado por el nuevo conjunto de datos multimodal MedMassage-12K y un benchmark para evaluar tareas de masaje en la atención sanitaria.

Rongtao Xu, Mingming Yu, Xiaofeng Han, Yu Zhang, Kaiyi Hu, Zhe Feng, Zenghuang Fu, Changwei Wang, Weiliang Meng, Xiaopeng ZhangWed, 11 Ma💻 cs

← Anterior Siguiente →