ReconDrive: Fast Feed-Forward 4D Gaussian Splatting for Autonomous Driving Scene Reconstruction

ReconDrive es un marco de trabajo feed-forward que adapta el modelo fundacional VGGT mediante cabezales de predicción híbridos y una estrategia de composición estático-dinámica para generar rápidamente representaciones 4D de alta fidelidad de escenas de conducción autónoma, superando a los métodos existentes en velocidad y calidad de síntesis de nuevas vistas.

Haibao Yu, Kuntao Xiao, Jiahang Wang, Ruiyang Hao, Yuxin Huang, Guoran Hu, Haifang Qin, Bowen Jing, Yuntian Bo, Ping Luo2026-03-10💻 cs

Approximate Imitation Learning for Event-based Quadrotor Flight in Cluttered Environments

Este trabajo presenta un enfoque novedoso de Aprendizaje por Imitación Aproximado que permite a un cuadrotor volar a alta velocidad en entornos congestionados utilizando únicamente una cámara de eventos, superando los desafíos de simulación mediante el entrenamiento de una política en línea basada en estados simulados ligeros tras aprender una representación a partir de un conjunto de datos masivo.

Nico Messikommer, Jiaxu Xing, Leonard Bauersfeld, Marco Cannici, Elie Aljalbout, Davide Scaramuzza2026-03-10💻 cs

FeasibleCap: Real-Time Embodiment Constraint Guidance for In-the-Wild Robot Demonstration Collection

FeasibleCap es un sistema de recolección de demostraciones "gripper-in-hand" que proporciona retroalimentación de ejecutabilidad en tiempo real mediante superposiciones visuales y señales hápticas, permitiendo a los demostradores corregir movimientos durante la captura sin necesidad de modelos aprendidos, hardware robótico o dispositivos de realidad aumentada, mejorando así la tasa de éxito de las trayectorias sin sacrificar la transferencia entre diferentes plataformas robóticas.

Zi Yin, Fanhong Li, Yun Gui, Jia Liu2026-03-10💻 cs

GeoLoco: Leveraging 3D Geometric Priors from Visual Foundation Model for Robust RGB-Only Humanoid Locomotion

GeoLoco es un marco de locomoción para humanoides que utiliza exclusivamente imágenes RGB y aprovecha los priores geométricos de un modelo fundacional visual congelado, junto con un mecanismo de atención cruzada y un esquema de aprendizaje auxiliar, para lograr una transferencia cero-shot robusta desde la simulación al robot Unitree G1 en terrenos complejos.

Yufei Liu, Xieyuanli Chen, Hainan Pan, Chenghao Shi, Yanjie Chen, Kaihong Huang, Zhiwen Zeng, Huimin Lu2026-03-10💻 cs

Exoskeleton Control through Learning to Reduce Biological Joint Moments in Simulations

Este artículo presenta un marco de aprendizaje por refuerzo para entrenar controladores de exoesqueleto en simulación que reducen los momentos articulares biológicos, validando su consistencia con datos reales mediante un pipeline que demuestra una fuerte correlación temporal en los torques de asistencia, especialmente en la cadera, a pesar de ciertas discrepancias en velocidades e inclinaciones más extremas.

Zihang You, Xianlian Zhou2026-03-10🤖 cs.LG

PanoDP: Learning Collision-Free Navigation with Panoramic Depth and Differentiable Physics

El artículo presenta PanoDP, un marco de aprendizaje sin comunicación que combina la percepción de profundidad panorámica de cuatro vistas con señales de entrenamiento basadas en física diferenciable para lograr una navegación autónoma libre de colisiones en entornos desordenados y dinámicos, superando a las líneas base existentes en tasas de finalización y seguridad.

Hao Zhong, Pei Chi, Jiang Zhao, Shenghai Yuan, Xuyang Gao, Thien-Minh Nguyen, Lihua Xie2026-03-10💻 cs

TempoFit: Plug-and-Play Layer-Wise Temporal KV Memory for Long-Horizon Vision-Language-Action Manipulation

TempoFit es un método de actualización temporal sin entrenamiento que mejora las políticas de Visión-Lenguaje-Acción preentrenadas para tareas de manipulación a largo plazo, al reutilizar y recuperar selectivamente memorias de llave-valor de capas anteriores mediante un sesgo temporal de recencia, logrando así un rendimiento superior sin aumentar la latencia ni requerir reentrenamiento.

Jun Sun, Boyu Yang, Jiahao Zhang, Ning Ma, Chencheng Wu, Siqing Zhang, Yiou Huang, Qiufeng Wang, Shan Liang, Yaran Chen2026-03-10💻 cs

AtomicVLA: Unlocking the Potential of Atomic Skill Learning in Robots

El artículo presenta AtomicVLA, un marco unificado de planificación y ejecución que utiliza una biblioteca de habilidades atómicas y un mecanismo de expertos guiado por habilidades para superar las limitaciones de escalabilidad y aprendizaje continuo de los modelos VLA existentes en tareas robóticas de largo horizonte.

Likui Zhang, Tao Tang, Zhihao Zhan, Xiuwei Chen, Zisheng Chen, Jianhua Han, Jiangtong Zhu, Pei Xu, Hang Xu, Hefeng Wu, Liang Lin, Xiaodan Liang2026-03-10💻 cs

Multi-Agent Off-World Exploration for Sparse Evidence Discovery via Gaussian Belief Mapping and Dual-Domain Coverage

Este artículo propone un marco de planificación de trayectorias informativas para múltiples agentes que utiliza mapas de creencia gaussianos y cobertura de doble dominio para descubrir evidencia dispersa en entornos extraterrestres peligrosos, superando las limitaciones de los métodos existentes al equilibrar la ganancia de información con la seguridad operativa y la robustez ante comunicaciones limitadas.

Zhuoran Qiao, Tianxin Hu, Thien-Minh Nguyen, Shenghai Yuan2026-03-10💻 cs

DAISS: Phase-Aware Imitation Learning for Dual-Arm Robotic Ultrasound-Guided Interventions

Este artículo presenta DAISS, un sistema de aprendizaje por imitación con conciencia de fase que automatiza la coordinación bimanual de robots para intervenciones guiadas por ultrasonido, permitiendo la transferencia precisa de estrategias expertas y reduciendo la carga cognitiva mediante el uso de demostraciones limitadas y retroalimentación visual en tiempo real.

Feng Li, Pei Liu, Shiting Wang, Ning Wang, Zhongliang Jiang, Nassir Navab, Yuan Bi2026-03-10💻 cs

Low-Cost Teleoperation Extension for Mobile Manipulators

Este artículo presenta un marco de teleoperación de código abierto y bajo costo que utiliza hardware comercial, como teléfonos inteligentes y pedales, para permitir el control intuitivo de manipuladores móviles bimanuales, logrando un mejor rendimiento y menor carga cognitiva en comparación con los métodos tradicionales basados en teclados.

Danil Belov, Artem Erkhov, Yaroslav Savotin, Tatiana Podladchikova, Pavel Osinenko2026-03-10💻 cs

UniUncer: Unified Dynamic Static Uncertainty for End to End Driving

El artículo presenta UniUncer, un marco unificado y ligero para la conducción de extremo a extremo que estima y aprovecha la incertidumbre tanto de elementos estáticos como dinámicos mediante regresores probabilísticos y una puerta adaptativa, logrando mejoras significativas en la precisión de la trayectoria y la seguridad sin sacrificar el rendimiento computacional.

Yu Gao, Jijun Wang, Zongzheng Zhang, Anqing Jiang, Yiru Wang, Yuwen Heng, Shuo Wang, Hao Sun, Zhangfeng Hu, Hao Zhao2026-03-10💻 cs

C2^2-Explorer: Contiguity-Driven Task Allocation with Connectivity-Aware Task Representation for Decentralized Multi-UAV Exploration

El artículo presenta C2^2-Explorer, un marco descentralizado para la exploración con múltiples UAVs que utiliza una representación de tareas consciente de la conectividad y una asignación impulsada por la contigüidad para superar las limitaciones de comunicación, reduciendo significativamente el tiempo de exploración y la longitud de la trayectoria en comparación con los métodos actuales.

Xinlu Yan, Mingjie Zhang, Yuhao Fang, Yanke Sun, Jun Ma, Youmin Gong, Boyu Zhou, Jie Mei2026-03-10💻 cs

AeroPlace-Flow: Language-Grounded Object Placement for Aerial Manipulators via Visual Foresight and Object Flow

El artículo presenta AeroPlace-Flow, un marco sin entrenamiento que permite a los manipuladores aéreos colocar objetos basándose en instrucciones de lenguaje natural mediante la síntesis de imágenes de objetivos, el razonamiento geométrico 3D y el flujo de objetos para generar trayectorias de ejecución exitosas.

Sarthak Mishra, Rishabh Dev Yadav, Naveen Nair, Wei Pan, Spandan Roy2026-03-10💻 cs

Directing the Robot: Scaffolding Creative Human-AI-Robot Interaction

El artículo propone un cambio de paradigma en la interacción humano-IA-robot, redefiniendo el rol de la inteligencia artificial como un andamiaje que permite a los humanos actuar como directores creativos que guían y revisan el comportamiento robótico, priorizando la agencia humana y la colaboración sobre la autonomía y la eficiencia.

Jordan Aiko Deja, Isidro Butaslac, Nicko Reginio Caluya, Maheshya Weerasinghe2026-03-10💻 cs