Iterative Convex Optimization with Control Barrier Functions for Obstacle Avoidance among Polytopes

Este artículo presenta un marco iterativo de control predictivo basado en modelos (MPC) y funciones de barrera de control (DCBF) que garantiza la colisión de robots y obstáculos poligónicos mediante la linealización local y hiperplanos de soporte, logrando así una planificación de trayectorias segura y en tiempo real para dinámicas no lineales complejas.

Shuo Liu, Zhe Huang, Calin A. Belta2026-03-09💻 cs

Swooper: Learning High-Speed Aerial Grasping With a Simple Gripper

El artículo presenta "Swooper", un enfoque de aprendizaje por refuerzo profundo que utiliza una estrategia de dos etapas y una sola red neuronal ligera para permitir que un dron cuadricóptero con un agarre sencillo realice tareas de agarre aéreo de alta velocidad (hasta 1.5 m/s) con un 84% de éxito en el mundo real, todo entrenado en menos de 60 minutos y ejecutado en tiempo real en un ordenador embarcado.

Ziken Huang, Xinze Niu, Bowen Chai, Renbiao Jin, Danping Zou2026-03-09💻 cs

PROBE: Probabilistic Occupancy BEV Encoding with Analytical Translation Robustness for 3D Place Recognition

PROBE es un descriptor de reconocimiento de lugares basado en LiDAR que, sin necesidad de aprendizaje, modela la ocupación en vistas aéreas como variables aleatorias de Bernoulli y utiliza una marginalización analítica para lograr una robustez ante traslaciones y generalización entre sensores, logrando un rendimiento superior entre los métodos no supervisados en múltiples conjuntos de datos.

Jinseop Lee, Byoungho Lee, Gichul Yoo2026-03-09💻 cs

HarvestFlex: Strawberry Harvesting via Vision-Language-Action Policy Adaptation in the Wild

Este trabajo presenta el primer estudio sobre la transferencia de políticas de visión-idioma-acción (VLA) a la cosecha real de fresas en invernadero, logrando un sistema de bucle cerrado con un 74% de éxito mediante el uso de sensores RGB, demostraciones teleoperadas y la adaptación de modelos como pi_0.5, sin depender de nubes de puntos de profundidad ni calibración geométrica explícita.

Ziyang Zhao, Shuheng Wang, Zhonghua Miao, Ya Xiong2026-03-09💻 cs

MagRobot:An Open Simulator for Magnetically Navigated Robots

El artículo presenta MagRobot, el primer simulador de código abierto universal que facilita el diseño, la visualización y la validación de robots navegados magnéticamente para aplicaciones médicas mínimamente invasivas, permitiendo la comparación de hardware y algoritmos en entornos anatómicos deformables.

Heng Wang (South China University of Technology), Haoyu Song (South China University of Technology), Jiatao Zheng (South China University of Technology), Yuxiang Han (South China University of Technology), Kunli Wang (South China University of Technology)2026-03-09💻 cs

Moving Through Clutter: Scaling Data Collection and Benchmarking for 3D Scene-Aware Humanoid Locomotion via Virtual Reality

Este trabajo presenta "Moving Through Clutter" (MTC), un marco de código abierto basado en realidad virtual que genera un conjunto de datos y benchmarks para la locomoción de humanoides en entornos 3D desordenados, capturando movimientos humanos completos y adaptándolos automáticamente a modelos robóticos para abordar la falta de investigación en navegación segura y consciente del entorno.

Beichen Wang, Yuanjie Lu, Linji Wang, Liuchuan Yu, Xuesu Xiao2026-03-09💻 cs

Restoring Linguistic Grounding in VLA Models via Train-Free Attention Recalibration

Este artículo presenta ICBench, un nuevo benchmark para diagnosticar la "ceguera lingüística" en modelos VLA que priorizan la visión sobre las instrucciones, y propone IGAR, un mecanismo de recalibración de atención sin entrenamiento que restaura la alineación lingüística y mejora la fiabilidad de los robots ante instrucciones contradictorias.

Ninghao Zhang, Bin Zhu, Shijie Zhou, Jingjing Chen2026-03-09🤖 cs.AI

Devil is in Narrow Policy: Unleashing Exploration in Driving VLA Models

El artículo presenta Curious-VLA, un marco de dos etapas que supera las limitaciones de políticas estrechas en los modelos VLA de conducción mediante la expansión de trayectorias factibles y un muestreo adaptativo, logrando así resultados de vanguardia en el benchmark Navsim al desbloquear el potencial exploratorio del aprendizaje por refuerzo.

Canyu Chen, Yuguang Yang, Zhewen Tan, Yizhi Wang, Ruiyi Zhan, Haiyan Liu, Xuanyao Mao, Jason Bao, Xinyue Tang, Linlin Yang, Bingchuan Sun, Yan Wang, Baochang Zhang2026-03-09💻 cs

Transforming Omnidirectional RGB-LiDAR data into 3D Gaussian Splatting

Este trabajo presenta un pipeline que transforma registros históricos omnidireccionales de RGB y LiDAR en inicializaciones robustas para la representación 3D mediante Gaussian Splatting, superando desafíos de distorsión y sobrecarga computacional mediante conversión a cubemap, muestreo estratificado y registro global para generar gemelos digitales de alta fidelidad.

Semin Bae, Hansol Lim, Jongseong Brad Choi2026-03-09💻 cs

Multimodal Behavior Tree Generation: A Small Vision-Language Model for Robot Task Planning

Este trabajo presenta un modelo de visión-idioma pequeño y de código abierto que, tras ser ajustado finamente con un nuevo dataset generado por un modelo grande, produce árboles de comportamiento para planificación robótica con un 87% de éxito en tareas domésticas, igualando el rendimiento de modelos cerrados de vanguardia con una fracción de los recursos computacionales.

Cristiano Battistini, Riccardo Andrea Izzo, Gianluca Bardaro, Matteo Matteucci2026-03-09💻 cs