cs.RO artículos | Gist.Science

Lifelong Language-Conditioned Robotic Manipulation Learning

Este artículo presenta SkillsCrafter, un marco novedoso para el aprendizaje continuo de manipulación robótica que mitiga el olvido catastrófico mediante la adaptación de habilidades y la agregación de especialización, permitiendo la adquisición dinámica de nuevas destrezas sin perder las anteriores.

Xudong Wang, Zebin Han, Zhiyu Liu + 5 more2026-03-06🤖 cs.AI

Critic in the Loop: A Tri-System VLA Framework for Robust Long-Horizon Manipulation

El artículo presenta "Critic in the Loop", un marco jerárquico adaptativo que integra un modelo de lenguaje y visión (VLM) para la planificación global, un modelo de acción de lenguaje y visión (VLA) para la ejecución reactiva y un crítico visual ligero que orquesta dinámicamente el control, logrando así un rendimiento robusto y de vanguardia en tareas de manipulación robótica a largo plazo.

Pengfei Yi, Yingjie Ma, Wenjiang Xu + 4 more2026-03-06💻 cs

Digital Twin Driven Textile Classification and Foreign Object Recognition in Automated Sorting Systems

Este trabajo presenta un sistema robótico de clasificación textil impulsado por gemelos digitales que integra percepción multimodal y modelos de lenguaje visual para la detección de objetos extraños y la clasificación de prendas en entornos industriales automatizados, demostrando la viabilidad de esta tecnología mediante la evaluación de nueve modelos VLM en escenarios reales.

Serkan Ergun, Tobias Mitterer, Hubert Zangl2026-03-06💻 cs

Rethinking the Role of Collaborative Robots in Rehabilitation

Este artículo propone ampliar el rol de los robots colaborativos en la rehabilitación física más allá del entrenamiento de movimientos repetitivos, explorando cómo pueden asistir a terapeutas y pacientes en todas las fases de la terapia para superar barreras de acceso, aunque su implementación enfrenta desafíos relacionados con la seguridad, la comprensión del estado del usuario y la integración en el flujo de trabajo clínico.

Vivek Gupte, Shalutha Rajapakshe, Emmanuel Senft2026-03-06💻 cs

Curve-Induced Dynamical Systems on Riemannian Manifolds and Lie Groups

Este artículo presenta CDSM, un marco en tiempo real que construye sistemas dinámicos sobre variedades riemannianas y grupos de Lie para generar comportamientos robóticos estables y adaptables, demostrando una mayor precisión y eficiencia tanto en benchmarks teóricos como en aplicaciones prácticas con manipuladores y robots móviles.

Saray Bakker, Martin Schonger, Tobias Löw + 2 more2026-03-06💻 cs

From Code to Road: A Vehicle-in-the-Loop and Digital Twin-Based Framework for Central Car Server Testing in Autonomous Driving

Este trabajo presenta un marco de prueba innovador para servidores centrales de vehículos autónomos que combina tecnología de Gemelo Digital y Vehículo en el Bucle (ViL) para integrar software completo en hardware real dentro de un entorno simulado, logrando así una validación más segura, realista y eficiente que los métodos tradicionales.

Chengdong Wu, Sven Kirchner, Nils Purschke + 9 more2026-03-06💻 cs

Iterative On-Policy Refinement of Hierarchical Diffusion Policies for Language-Conditioned Manipulation

El artículo presenta HD-ExpIt, un marco que mejora las políticas de difusión jerárquicas para la manipulación guiada por lenguaje mediante un ciclo de refinamiento iterativo que utiliza retroalimentación del entorno para alinear automáticamente la planificación de alto nivel con las capacidades reales del controlador, logrando un rendimiento superior en el benchmark CALVIN.

Clemence Grislain, Olivier Sigaud, Mohamed Chetouani2026-03-06💻 cs

Latent Policy Steering through One-Step Flow Policies

El artículo presenta Latent Policy Steering (LPS), un método de aprendizaje por refuerzo fuera de línea que logra un alto rendimiento y estabilidad en tareas robóticas al eliminar los críticos latentes proxy y utilizar una política MeanFlow diferenciable de un solo paso para guiar la optimización del actor en el espacio latente mediante gradientes de Q en el espacio de acciones originales.

Hokyun Im, Andrey Kolobov, Jianlong Fu + 1 more2026-03-06🤖 cs.LG

Constraint-Free Static Modeling of Continuum Parallel Robot

Este artículo presenta un modelo estático sin restricciones para robots paralelos continuos que elimina las restricciones cinemáticas mediante incrustación, permitiendo el cálculo eficiente de configuraciones bajo grandes deformaciones y rotaciones mediante una aproximación de Magnus y una iteración de Newton en variedades, lo cual ha sido validado experimentalmente.

Lingxiao Xun, Matyas Diezinger, Azad Artinian + 2 more2026-03-06💻 cs

UltraDexGrasp: Learning Universal Dexterous Grasping for Bimanual Robots with Synthetic Data

El paper presenta UltraDexGrasp, un marco que genera un dataset sintético masivo de 20 millones de frames para entrenar una política de agarre dúctil bimanual que logra una transferencia exitosa de simulación a realidad con un 81,2% de éxitos en objetos nuevos.

Sizhe Yang, Yiman Xie, Zhixuan Liang + 4 more2026-03-06💻 cs

CT-Enabled Patient-Specific Simulation and Contact-Aware Robotic Planning for Cochlear Implantation

Este artículo presenta un pipeline unificado que integra imágenes de TC y modelos de varas de Cosserat diferenciables para planificar y validar la inserción robótica de implantes cocleares, optimizando el control de fuerzas de contacto y reduciendo el riesgo de bloqueo o pandeo mediante una ley de actualización de dirección en tiempo real.

Lingxiao Xun, Gang Zheng, Alexandre Kruszewski + 1 more2026-03-06💻 cs

Omni-Manip: Beyond-FOV Large-Workspace Humanoid Manipulation with Omnidirectional 3D Perception

El artículo presenta Omni-Manip, una política visuomotora impulsada por LiDAR que utiliza percepción omnidireccional y un mecanismo de agrupación de atención consciente del tiempo para permitir que los robots humanoides realicen manipulaciones dexterosas en grandes espacios de trabajo sin necesidad de reubicación frecuente, superando así las limitaciones de campo de visión y oclusión de los sistemas RGB-D convencionales.

Pei Qu, Zheng Li, Yufei Jia + 5 more2026-03-06💻 cs

OpenFrontier: General Navigation with Visual-Language Grounded Frontiers

OpenFrontier es un marco de navegación libre de entrenamiento que integra modelos de visión y lenguaje para identificar y alcanzar fronteras semánticas como subobjetivos, permitiendo una navegación eficiente en entornos abiertos sin necesidad de reconstrucción 3D densa, entrenamiento de políticas o ajuste fino.

Esteban Padilla, Boyang Sun, Marc Pollefeys + 1 more2026-03-06💻 cs

Accelerating Sampling-Based Control via Learned Linear Koopman Dynamics

Este artículo presenta MPPI-DK, un marco de control predictivo que acelera el muestreo en sistemas no lineales complejos mediante el uso de un operador de Koopman profundo aprendido, logrando un rendimiento de control cercano al óptimo con una reducción sustancial del costo computacional en plataformas robóticas.

Wenjian Hao, Yuxuan Fang, Zehui Lu + 1 more2026-03-06💻 cs

Loop Closure via Maximal Cliques in 3D LiDAR-Based SLAM

Este artículo presenta CliReg, un algoritmo determinista basado en la búsqueda de cliques máximos que sustituye a RANSAC para la validación de cierres de bucle en SLAM con LiDAR 3D, logrando una mayor robustez, menor error de pose y una detección más fiable en condiciones de ruido y ambigüedad.

Javier Laserna, Saurabh Gupta, Oscar Martinez Mozos + 2 more2026-03-06💻 cs

ROScopter: A Multirotor Autopilot based on ROSflight 2.0

El artículo presenta ROScopter, un autopiloto ligero para drones multirotor diseñado para investigadores que, al ejecutarse completamente en un ordenador de vuelo a bordo e integrarse con ROSflight 2.0 y ROS 2, facilita la prueba de código de investigación en simulación y hardware, logrando un rendimiento comparable al de los sistemas más avanzados pero con una base de código significativamente más reducida y modular.

Jacob Moore, Ian Reid, Phil Tokumaru + 1 more2026-03-06💻 cs

PhysiFlow: Physics-Aware Humanoid Whole-Body VLA via Multi-Brain Latent Flow Matching and Robust Tracking

El artículo presenta PhysiFlow, un marco VLA consciente de la física y guiado por la intención semántico-motriz que utiliza un flujo latente de "multi-cerebro" y seguimiento robusto para lograr una coordinación corporal completa estable y eficiente en robots humanoides.

Weikai Qin, Sichen Wu, Ci Chen + 5 more2026-03-06💻 cs

Planning in 8 Tokens: A Compact Discrete Tokenizer for Latent World Model

El artículo presenta CompACT, un tokenizador discreto que comprime las observaciones en solo 8 tokens para permitir una planificación eficiente en tiempo real mediante modelos de mundo latente, superando las limitaciones computacionales de los enfoques anteriores.

Dongwon Kim, Gawon Seo, Jinsung Lee + 2 more2026-03-06🤖 cs.AI

Residual RL--MPC for Robust Microrobotic Cell Pushing Under Time-Varying Flow

Este artículo presenta un controlador híbrido que combina un MPC nominal con una política residual aprendida mediante SAC para mejorar la robustez y precisión en el empuje de células mediante microrobots magnéticos bajo flujos variables, logrando un rendimiento superior al de los métodos tradicionales y una generalización efectiva a trayectorias no vistas.

Yanda Yang, Sambeeta Das2026-03-06🤖 cs.AI

Observing and Controlling Features in Vision-Language-Action Models

Este trabajo cierra la brecha en la interpretabilidad de los Modelos Visión-Lenguaje-Acción (VLAs) proponiendo y validando los conceptos de observabilidad y controlabilidad de características, lo que permite intervenir linealmente en las representaciones internas para guiar el comportamiento de los robots en tiempo real sin necesidad de ajuste fino.

Hugo Buurmeijer, Carmen Amo Alonso, Aiden Swann + 1 more2026-03-06💻 cs

← Anterior Siguiente →