RehearseVLA: Simulated Post-Training for VLAs with Physically-Consistent World Model

El artículo presenta RehearseVLA, un marco de post-entrenamiento basado en aprendizaje por refuerzo que utiliza un simulador de mundo virtual físicamente consistente y un reflejo instantáneo guiado por modelos de visión-lingüística para superar las limitaciones de datos, seguridad y eficiencia en el entrenamiento de modelos Visión-Lenguaje-Acción en entornos reales.

Junjin Xiao, Yandan Yang, Xinyuan Chang + 5 more2026-03-05💻 cs

ELMUR: External Layer Memory with Update/Rewrite for Long-Horizon RL Problems

El artículo presenta ELMUR, una arquitectura de transformador con memoria externa estructurada que supera las limitaciones de los modelos actuales al permitir a los agentes robóticos retener y aprovechar dependencias a largo plazo en entornos parcialmente observables, logrando un rendimiento superior en tareas de manipulación y navegación de horizonte extenso.

Egor Cherepanov, Alexey K. Kovalev, Aleksandr I. Panov2026-03-05🤖 cs.AI

LaViRA: Language-Vision-Robot Actions Translation for Zero-Shot Vision Language Navigation in Continuous Environments

LaViRA es un marco de navegación visión-lenguaje en entornos continuos (VLN-CE) de cero disparos que supera las limitaciones de generalización y razonamiento de los métodos actuales mediante una jerarquía de acciones de coarse-to-fine que integra la planificación lingüística, el anclaje perceptivo visual y el control robótico utilizando modelos de lenguaje multimodal de diferentes escalas.

Hongyu Ding, Ziming Xu, Yudong Fang + 6 more2026-03-05💻 cs

SoraNav: Adaptive UAV Task-Centric Navigation via Zeroshot VLM Reasoning

El artículo presenta SoraNav, un marco innovador que permite la navegación autónoma de drones basada en instrucciones de lenguaje natural mediante el razonamiento de modelos visuales-lingüísticos cero-shot, superando las limitaciones espaciales y semánticas actuales mediante anotaciones visuales multimodales y una estrategia de toma de decisiones adaptativa que mejora significativamente el éxito y la eficiencia en entornos 3D complejos.

Hongyu Song, Rishabh Dev Yadav, Cheng Guo + 1 more2026-03-05💻 cs

Dynamic-ICP: Doppler-Aware Iterative Closest Point Registration for Dynamic Scenes

El artículo presenta Dynamic-ICP, un marco de registro basado en ICP que aprovecha las velocidades Doppler de los puntos individuales para estimar el movimiento del vehículo, filtrar objetos dinámicos y alinear escaneos de LiDAR FMCW en entornos altamente dinámicos, logrando una mayor estabilidad y precisión sin necesidad de sensores externos.

Dong Wang, Daniel Casado Herraez, Stefan May + 1 more2026-03-05💻 cs

Learning Physical Principles from Interaction: Self-Evolving Planning via Test-Time Memory

El artículo presenta PhysMem, un marco de memoria que permite a los planificadores de robots basados en modelos visuales-lingüísticos aprender principios físicos mediante la interacción en tiempo de prueba mediante la generación y verificación de hipótesis antes de su aplicación, mejorando significativamente el éxito en tareas de manipulación sin actualizar los parámetros del modelo.

Haoyang Li, Yang You, Hao Su + 1 more2026-03-05🤖 cs.AI

Multi-Agent-Based Simulation of Archaeological Mobility in Uneven Landscapes

Este artículo presenta un marco de simulación basado en agentes múltiples que integra datos topográficos reales y aprendizaje por refuerzo para modelar la movilidad arqueológica en terrenos irregulares, permitiendo analizar cómo la morfología del paisaje y la heterogeneidad de los agentes influyen en las estrategias de transporte y movimiento del pasado.

Chairi Kiourt, Vassilis Evangelidis, Dimitris Grigoropoulos2026-03-05🤖 cs.AI

Real-time loosely coupled GNSS and IMU integration via Factor Graph Optimization

Este artículo propone una arquitectura de integración en tiempo real y acoplamiento suelto entre GNSS e IMU mediante Optimización de Grafos de Factores, demostrando en entornos urbanos que, aunque se sacrifica ligeramente la precisión de posicionamiento, se logra una mayor disponibilidad del servicio y eficiencia computacional en comparación con los métodos por lotes.

Radu-Andrei Cioaca, Cristian Rusu, Paul Irofti + 3 more2026-03-05🤖 cs.LG