RehearseVLA: Simulated Post-Training for VLAs with Physically-Consistent World Model

Le papier présente RehearseVLA, un cadre d'entraînement postérieur basé sur l'apprentissage par renforcement qui utilise un simulateur de monde virtuel physiquement cohérent et un réflecteur guidé par un modèle vision-langage pour surmonter les limitations de données et de sécurité des modèles VLA traditionnels, permettant ainsi un apprentissage efficace avec très peu de démonstrations expertes.

Junjin Xiao, Yandan Yang, Xinyuan Chang + 5 more2026-03-05💻 cs

ELMUR: External Layer Memory with Update/Rewrite for Long-Horizon RL Problems

Le papier présente ELMUR, une architecture de transformateur dotée d'une mémoire externe structurée et mise à jour localement par couche, qui résout efficacement les problèmes d'apprentissage par renforcement à long horizon et sous observabilité partielle en surpassant significativement les méthodes de référence sur des tâches robotiques complexes.

Egor Cherepanov, Alexey K. Kovalev, Aleksandr I. Panov2026-03-05🤖 cs.AI

TIGeR: Tool-Integrated Geometric Reasoning in Vision-Language Models for Robotics

Ce papier présente TIGeR, un cadre novateur qui améliore la précision géométrique des modèles vision-langage pour la robotique en leur permettant de générer et d'exécuter du code via des outils externes, surpassant ainsi les limitations des approches purement qualitatives pour atteindre une précision centimétrique dans les tâches de manipulation réelle.

Yi Han, Enshen Zhou, Shanyu Rong + 6 more2026-03-05🤖 cs.AI

LaViRA: Language-Vision-Robot Actions Translation for Zero-Shot Vision Language Navigation in Continuous Environments

LaViRA est un cadre de navigation vision-langage en environnement continu sans apprentissage préalable qui surpasse les méthodes actuelles en décomposant l'action en une hiérarchie à trois niveaux (planification linguistique, ancrage perceptif visuel et contrôle robotique) pour exploiter efficacement les capacités de différents modèles de langage multimodaux.

Hongyu Ding, Ziming Xu, Yudong Fang + 6 more2026-03-05💻 cs

SoraNav: Adaptive UAV Task-Centric Navigation via Zeroshot VLM Reasoning

Le papier présente SoraNav, un cadre innovant permettant la navigation autonome de drones aériens (UAV) via un raisonnement zero-shot de modèles vision-langage, en comblant le fossé spatial-sémantique grâce à des annotations visuelles multi-modales et une stratégie de décision adaptative pour garantir la faisabilité géométrique dans des environnements 3D complexes.

Hongyu Song, Rishabh Dev Yadav, Cheng Guo + 1 more2026-03-05💻 cs

Agile Flight Emerges from Multi-Agent Competitive Racing

En s'appuyant sur des simulations et des tests réels, cette étude démontre que l'entraînement par compétition multi-agents avec une récompense de tâche sparse (gagner la course) permet d'émerger un vol agile et des stratégies de course supérieures, offrant une meilleure transférabilité vers le monde réel et une plus grande généralisation que les méthodes traditionnelles d'apprentissage en isolation avec des récompenses prescriptives.

Vineet Pasumarti, Lorenzo Bianchi, Antonio Loquercio2026-03-05🤖 cs.AI

FlowCorrect: Efficient Interactive Correction of Generative Flow Policies for Robotic Manipulation

FlowCorrect est une méthode d'apprentissage par imitation interactive et modulaire qui permet d'adapter en temps réel les politiques de manipulation robotique basées sur l'appariement de flux à l'aide de corrections humaines éparses, améliorant ainsi le taux de succès lors du déploiement sans nécessiter de réentraînement du modèle.

Edgar Welte, Yitian Shi, Rosa Wolf + 2 more2026-03-05🤖 cs.LG

Multi-Agent-Based Simulation of Archaeological Mobility in Uneven Landscapes

Cet article présente un cadre de modélisation multi-agents intégrant l'apprentissage par renforcement et des données topographiques réalistes pour simuler la mobilité archéologique dans des paysages accidentés, permettant d'analyser l'impact du terrain et de l'hétérogénéité des agents sur les stratégies de déplacement et d'interaction.

Chairi Kiourt, Vassilis Evangelidis, Dimitris Grigoropoulos2026-03-05🤖 cs.AI