Critic in the Loop: A Tri-System VLA Framework for Robust Long-Horizon Manipulation

El artículo presenta "Critic in the Loop", un marco jerárquico adaptativo que integra un modelo de lenguaje y visión (VLM) para la planificación global, un modelo de acción de lenguaje y visión (VLA) para la ejecución reactiva y un crítico visual ligero que orquesta dinámicamente el control, logrando así un rendimiento robusto y de vanguardia en tareas de manipulación robótica a largo plazo.

Pengfei Yi, Yingjie Ma, Wenjiang Xu + 4 more2026-03-06💻 cs

Digital Twin Driven Textile Classification and Foreign Object Recognition in Automated Sorting Systems

Este trabajo presenta un sistema robótico de clasificación textil impulsado por gemelos digitales que integra percepción multimodal y modelos de lenguaje visual para la detección de objetos extraños y la clasificación de prendas en entornos industriales automatizados, demostrando la viabilidad de esta tecnología mediante la evaluación de nueve modelos VLM en escenarios reales.

Serkan Ergun, Tobias Mitterer, Hubert Zangl2026-03-06💻 cs

Rethinking the Role of Collaborative Robots in Rehabilitation

Este artículo propone ampliar el rol de los robots colaborativos en la rehabilitación física más allá del entrenamiento de movimientos repetitivos, explorando cómo pueden asistir a terapeutas y pacientes en todas las fases de la terapia para superar barreras de acceso, aunque su implementación enfrenta desafíos relacionados con la seguridad, la comprensión del estado del usuario y la integración en el flujo de trabajo clínico.

Vivek Gupte, Shalutha Rajapakshe, Emmanuel Senft2026-03-06💻 cs

From Code to Road: A Vehicle-in-the-Loop and Digital Twin-Based Framework for Central Car Server Testing in Autonomous Driving

Este trabajo presenta un marco de prueba innovador para servidores centrales de vehículos autónomos que combina tecnología de Gemelo Digital y Vehículo en el Bucle (ViL) para integrar software completo en hardware real dentro de un entorno simulado, logrando así una validación más segura, realista y eficiente que los métodos tradicionales.

Chengdong Wu, Sven Kirchner, Nils Purschke + 9 more2026-03-06💻 cs

Iterative On-Policy Refinement of Hierarchical Diffusion Policies for Language-Conditioned Manipulation

El artículo presenta HD-ExpIt, un marco que mejora las políticas de difusión jerárquicas para la manipulación guiada por lenguaje mediante un ciclo de refinamiento iterativo que utiliza retroalimentación del entorno para alinear automáticamente la planificación de alto nivel con las capacidades reales del controlador, logrando un rendimiento superior en el benchmark CALVIN.

Clemence Grislain, Olivier Sigaud, Mohamed Chetouani2026-03-06💻 cs

Latent Policy Steering through One-Step Flow Policies

El artículo presenta Latent Policy Steering (LPS), un método de aprendizaje por refuerzo fuera de línea que logra un alto rendimiento y estabilidad en tareas robóticas al eliminar los críticos latentes proxy y utilizar una política MeanFlow diferenciable de un solo paso para guiar la optimización del actor en el espacio latente mediante gradientes de Q en el espacio de acciones originales.

Hokyun Im, Andrey Kolobov, Jianlong Fu + 1 more2026-03-06🤖 cs.LG

Constraint-Free Static Modeling of Continuum Parallel Robot

Este artículo presenta un modelo estático sin restricciones para robots paralelos continuos que elimina las restricciones cinemáticas mediante incrustación, permitiendo el cálculo eficiente de configuraciones bajo grandes deformaciones y rotaciones mediante una aproximación de Magnus y una iteración de Newton en variedades, lo cual ha sido validado experimentalmente.

Lingxiao Xun, Matyas Diezinger, Azad Artinian + 2 more2026-03-06💻 cs

CT-Enabled Patient-Specific Simulation and Contact-Aware Robotic Planning for Cochlear Implantation

Este artículo presenta un pipeline unificado que integra imágenes de TC y modelos de varas de Cosserat diferenciables para planificar y validar la inserción robótica de implantes cocleares, optimizando el control de fuerzas de contacto y reduciendo el riesgo de bloqueo o pandeo mediante una ley de actualización de dirección en tiempo real.

Lingxiao Xun, Gang Zheng, Alexandre Kruszewski + 1 more2026-03-06💻 cs

Omni-Manip: Beyond-FOV Large-Workspace Humanoid Manipulation with Omnidirectional 3D Perception

El artículo presenta Omni-Manip, una política visuomotora impulsada por LiDAR que utiliza percepción omnidireccional y un mecanismo de agrupación de atención consciente del tiempo para permitir que los robots humanoides realicen manipulaciones dexterosas en grandes espacios de trabajo sin necesidad de reubicación frecuente, superando así las limitaciones de campo de visión y oclusión de los sistemas RGB-D convencionales.

Pei Qu, Zheng Li, Yufei Jia + 5 more2026-03-06💻 cs

ROScopter: A Multirotor Autopilot based on ROSflight 2.0

El artículo presenta ROScopter, un autopiloto ligero para drones multirotor diseñado para investigadores que, al ejecutarse completamente en un ordenador de vuelo a bordo e integrarse con ROSflight 2.0 y ROS 2, facilita la prueba de código de investigación en simulación y hardware, logrando un rendimiento comparable al de los sistemas más avanzados pero con una base de código significativamente más reducida y modular.

Jacob Moore, Ian Reid, Phil Tokumaru + 1 more2026-03-06💻 cs