ReconDrive: Fast Feed-Forward 4D Gaussian Splatting for Autonomous Driving Scene Reconstruction

ReconDrive es un marco de trabajo feed-forward que adapta el modelo fundacional VGGT mediante cabezales de predicción híbridos y una estrategia de composición estático-dinámica para generar rápidamente representaciones 4D de alta fidelidad de escenas de conducción autónoma, superando a los métodos existentes en velocidad y calidad de síntesis de nuevas vistas.

Haibao Yu, Kuntao Xiao, Jiahang Wang, Ruiyang Hao, Yuxin Huang, Guoran Hu, Haifang Qin, Bowen Jing, Yuntian Bo, Ping LuoTue, 10 Ma💻 cs

Approximate Imitation Learning for Event-based Quadrotor Flight in Cluttered Environments

Este trabajo presenta un enfoque novedoso de Aprendizaje por Imitación Aproximado que permite a un cuadrotor volar a alta velocidad en entornos congestionados utilizando únicamente una cámara de eventos, superando los desafíos de simulación mediante el entrenamiento de una política en línea basada en estados simulados ligeros tras aprender una representación a partir de un conjunto de datos masivo.

Nico Messikommer, Jiaxu Xing, Leonard Bauersfeld, Marco Cannici, Elie Aljalbout, Davide ScaramuzzaTue, 10 Ma💻 cs

FeasibleCap: Real-Time Embodiment Constraint Guidance for In-the-Wild Robot Demonstration Collection

FeasibleCap es un sistema de recolección de demostraciones "gripper-in-hand" que proporciona retroalimentación de ejecutabilidad en tiempo real mediante superposiciones visuales y señales hápticas, permitiendo a los demostradores corregir movimientos durante la captura sin necesidad de modelos aprendidos, hardware robótico o dispositivos de realidad aumentada, mejorando así la tasa de éxito de las trayectorias sin sacrificar la transferencia entre diferentes plataformas robóticas.

Zi Yin, Fanhong Li, Yun Gui, Jia LiuTue, 10 Ma💻 cs

GeoLoco: Leveraging 3D Geometric Priors from Visual Foundation Model for Robust RGB-Only Humanoid Locomotion

GeoLoco es un marco de locomoción para humanoides que utiliza exclusivamente imágenes RGB y aprovecha los priores geométricos de un modelo fundacional visual congelado, junto con un mecanismo de atención cruzada y un esquema de aprendizaje auxiliar, para lograr una transferencia cero-shot robusta desde la simulación al robot Unitree G1 en terrenos complejos.

Yufei Liu, Xieyuanli Chen, Hainan Pan, Chenghao Shi, Yanjie Chen, Kaihong Huang, Zhiwen Zeng, Huimin LuTue, 10 Ma💻 cs

Exoskeleton Control through Learning to Reduce Biological Joint Moments in Simulations

Este artículo presenta un marco de aprendizaje por refuerzo para entrenar controladores de exoesqueleto en simulación que reducen los momentos articulares biológicos, validando su consistencia con datos reales mediante un pipeline que demuestra una fuerte correlación temporal en los torques de asistencia, especialmente en la cadera, a pesar de ciertas discrepancias en velocidades e inclinaciones más extremas.

Zihang You, Xianlian ZhouTue, 10 Ma🤖 cs.LG

PanoDP: Learning Collision-Free Navigation with Panoramic Depth and Differentiable Physics

El artículo presenta PanoDP, un marco de aprendizaje sin comunicación que combina la percepción de profundidad panorámica de cuatro vistas con señales de entrenamiento basadas en física diferenciable para lograr una navegación autónoma libre de colisiones en entornos desordenados y dinámicos, superando a las líneas base existentes en tasas de finalización y seguridad.

Hao Zhong, Pei Chi, Jiang Zhao, Shenghai Yuan, Xuyang Gao, Thien-Minh Nguyen, Lihua XieTue, 10 Ma💻 cs

TempoFit: Plug-and-Play Layer-Wise Temporal KV Memory for Long-Horizon Vision-Language-Action Manipulation

TempoFit es un método de actualización temporal sin entrenamiento que mejora las políticas de Visión-Lenguaje-Acción preentrenadas para tareas de manipulación a largo plazo, al reutilizar y recuperar selectivamente memorias de llave-valor de capas anteriores mediante un sesgo temporal de recencia, logrando así un rendimiento superior sin aumentar la latencia ni requerir reentrenamiento.

Jun Sun, Boyu Yang, Jiahao Zhang, Ning Ma, Chencheng Wu, Siqing Zhang, Yiou Huang, Qiufeng Wang, Shan Liang, Yaran ChenTue, 10 Ma💻 cs

AtomicVLA: Unlocking the Potential of Atomic Skill Learning in Robots

El artículo presenta AtomicVLA, un marco unificado de planificación y ejecución que utiliza una biblioteca de habilidades atómicas y un mecanismo de expertos guiado por habilidades para superar las limitaciones de escalabilidad y aprendizaje continuo de los modelos VLA existentes en tareas robóticas de largo horizonte.

Likui Zhang, Tao Tang, Zhihao Zhan, Xiuwei Chen, Zisheng Chen, Jianhua Han, Jiangtong Zhu, Pei Xu, Hang Xu, Hefeng Wu, Liang Lin, Xiaodan LiangTue, 10 Ma💻 cs

Multi-Agent Off-World Exploration for Sparse Evidence Discovery via Gaussian Belief Mapping and Dual-Domain Coverage

Este artículo propone un marco de planificación de trayectorias informativas para múltiples agentes que utiliza mapas de creencia gaussianos y cobertura de doble dominio para descubrir evidencia dispersa en entornos extraterrestres peligrosos, superando las limitaciones de los métodos existentes al equilibrar la ganancia de información con la seguridad operativa y la robustez ante comunicaciones limitadas.

Zhuoran Qiao, Tianxin Hu, Thien-Minh Nguyen, Shenghai YuanTue, 10 Ma💻 cs

DAISS: Phase-Aware Imitation Learning for Dual-Arm Robotic Ultrasound-Guided Interventions

Este artículo presenta DAISS, un sistema de aprendizaje por imitación con conciencia de fase que automatiza la coordinación bimanual de robots para intervenciones guiadas por ultrasonido, permitiendo la transferencia precisa de estrategias expertas y reduciendo la carga cognitiva mediante el uso de demostraciones limitadas y retroalimentación visual en tiempo real.

Feng Li, Pei Liu, Shiting Wang, Ning Wang, Zhongliang Jiang, Nassir Navab, Yuan BiTue, 10 Ma💻 cs

Low-Cost Teleoperation Extension for Mobile Manipulators

Este artículo presenta un marco de teleoperación de código abierto y bajo costo que utiliza hardware comercial, como teléfonos inteligentes y pedales, para permitir el control intuitivo de manipuladores móviles bimanuales, logrando un mejor rendimiento y menor carga cognitiva en comparación con los métodos tradicionales basados en teclados.

Danil Belov, Artem Erkhov, Yaroslav Savotin, Tatiana Podladchikova, Pavel OsinenkoTue, 10 Ma💻 cs

UniUncer: Unified Dynamic Static Uncertainty for End to End Driving

El artículo presenta UniUncer, un marco unificado y ligero para la conducción de extremo a extremo que estima y aprovecha la incertidumbre tanto de elementos estáticos como dinámicos mediante regresores probabilísticos y una puerta adaptativa, logrando mejoras significativas en la precisión de la trayectoria y la seguridad sin sacrificar el rendimiento computacional.

Yu Gao, Jijun Wang, Zongzheng Zhang, Anqing Jiang, Yiru Wang, Yuwen Heng, Shuo Wang, Hao Sun, Zhangfeng Hu, Hao ZhaoTue, 10 Ma💻 cs

C2^2-Explorer: Contiguity-Driven Task Allocation with Connectivity-Aware Task Representation for Decentralized Multi-UAV Exploration

El artículo presenta C2^2-Explorer, un marco descentralizado para la exploración con múltiples UAVs que utiliza una representación de tareas consciente de la conectividad y una asignación impulsada por la contigüidad para superar las limitaciones de comunicación, reduciendo significativamente el tiempo de exploración y la longitud de la trayectoria en comparación con los métodos actuales.

Xinlu Yan, Mingjie Zhang, Yuhao Fang, Yanke Sun, Jun Ma, Youmin Gong, Boyu Zhou, Jie MeiTue, 10 Ma💻 cs

AeroPlace-Flow: Language-Grounded Object Placement for Aerial Manipulators via Visual Foresight and Object Flow

El artículo presenta AeroPlace-Flow, un marco sin entrenamiento que permite a los manipuladores aéreos colocar objetos basándose en instrucciones de lenguaje natural mediante la síntesis de imágenes de objetivos, el razonamiento geométrico 3D y el flujo de objetos para generar trayectorias de ejecución exitosas.

Sarthak Mishra, Rishabh Dev Yadav, Naveen Nair, Wei Pan, Spandan RoyTue, 10 Ma💻 cs

Directing the Robot: Scaffolding Creative Human-AI-Robot Interaction

El artículo propone un cambio de paradigma en la interacción humano-IA-robot, redefiniendo el rol de la inteligencia artificial como un andamiaje que permite a los humanos actuar como directores creativos que guían y revisan el comportamiento robótico, priorizando la agencia humana y la colaboración sobre la autonomía y la eficiencia.

Jordan Aiko Deja, Isidro Butaslac, Nicko Reginio Caluya, Maheshya WeerasingheTue, 10 Ma💻 cs

Residual Control for Fast Recovery from Dynamics Shifts

El artículo propone una arquitectura de control residual alineada con la estabilidad que, mediante un "puerta de alineación de estabilidad" (SAG) y un policy de refuerzo congelado, permite a los sistemas robóticos recuperarse rápidamente de cambios dinámicos no observados durante la ejecución, reduciendo significativamente el tiempo de recuperación en comparación con políticas fijas o de adaptación en línea.

Nethmi Jayasinghe, Diana Gontero, Francesco Migliarba, Spencer T. Brown, Vinod K. Sangwan, Mark C. Hersam, Amit Ranjan TrivediTue, 10 Ma💻 cs