STRIDE: Structured Lagrangian and Stochastic Residual Dynamics via Flow Matching

Le papier présente STRIDE, un cadre d'apprentissage dynamique qui sépare la mécanique rigide conservatrice modélisée par un réseau de neurones lagrangien des effets d'interaction stochastiques capturés par l'appariement de flux conditionnel, afin d'améliorer la précision des prédictions et la fiabilité du contrôle pour les robots opérant dans des environnements incertains.

Prakrut Kotecha, Ganga Nair B, Shishir Kolathaya2026-03-10🤖 cs.LG

Interactive World Simulator for Robot Policy Training and Evaluation

Les auteurs présentent l'Interactive World Simulator, un cadre utilisant des modèles de cohérence pour générer des simulations robotiques interactives, rapides et physiquement cohérentes, permettant d'entraîner et d'évaluer des politiques d'imitation avec des performances comparables à celles obtenues avec des données réelles.

Yixuan Wang, Rhythm Syed, Fangyu Wu, Mengchao Zhang, Aykut Onol, Jose Barreiros, Hooshang Nayyeri, Tony Dear, Huan Zhang, Yunzhu Li2026-03-10🤖 cs.LG

RAG-Driver: Generalisable Driving Explanations with Retrieval-Augmented In-Context Learning in Multi-Modal Large Language Model

Le papier présente RAG-Driver, un modèle de langage multimodal augmenté par la récupération qui utilise l'apprentissage en contexte à partir de démonstrations expertes pour générer des explications de conduite fiables et des prédictions de contrôle, tout en assurant une généralisation exceptionnelle à des environnements non vus sans nécessiter de réentraînement.

Jianhao Yuan, Shuyang Sun, Daniel Omeiza, Bo Zhao, Paul Newman, Lars Kunze, Matthew Gadd2026-03-09🤖 cs.AI

FALCON: Future-Aware Learning with Contextual Object-Centric Pretraining for UAV Action Recognition

Le papier présente FALCON, une méthode d'apprentissage auto-supervisé unifiée pour la reconnaissance d'actions par drone, qui surmonte les déséquilibres spatiaux des vidéos aériennes en intégrant un masquage centré sur les objets et une reconstruction du futur à double horizon pour améliorer la précision et la vitesse d'inférence.

Ruiqi Xian, Xiyang Wu, Tianrui Guan, Xijun Wang, Boqing Gong, Dinesh Manocha2026-03-09🤖 cs.AI

Integrated Hierarchical Decision-Making in Inverse Kinematic Planning and Control

Cet article présente un cadre novateur de programmation non linéaire qui intègre efficacement la prise de décision hiérarchique à la planification et au contrôle cinématiques inverses en exploitant la norme 0\ell_0 pour résoudre des problèmes complexes comme la sélection simultanée de locations d'effecteurs ou de prises bimanuelles.

Kai Pfeiffer, Quan Zhang, Yuqing Chen, Gordon Boateng, Yuquan Wang, Vincent Bonnet, Aberrahmane Kheddar2026-03-09💻 cs

Generative Predictive Control: Flow Matching Policies for Dynamic and Difficult-to-Demonstrate Tasks

Ce papier présente le contrôle prédictif génératif, un cadre d'apprentissage supervisé qui combine la modélisation générative et le contrôle prédictif pour entraîner des politiques de robotique sur des tâches dynamiques difficiles à démontrer mais faciles à simuler, tout en permettant une rétroaction haute fréquence grâce à un amorçage temporel des modèles d'appariement de flux.

Vince Kurtz, Joel W. Burdick2026-03-09🤖 cs.AI

CAPS: Context-Aware Priority Sampling for Enhanced Imitation Learning in Autonomous Driving

Ce papier présente CAPS, une méthode de rééchantillonnage prioritaire contextuel utilisant des VQ-VAE pour équilibrer les données d'apprentissage par imitation et améliorer la généralisation des systèmes de conduite autonome dans le simulateur CARLA.

Hamidreza Mirkhani, Behzad Khamidehi, Ehsan Ahmadi, Mohammed Elmahgiubi, Weize Zhang, Fazel Arasteh, Umar Rajguru, Kasra Rezaee, Dongfeng Bai2026-03-09🤖 cs.LG

Whole-Body Model-Predictive Control of Legged Robots with MuJoCo

Ce papier démontre l'efficacité surprenante d'une approche simple basée sur l'algorithme iLQR couplé à MuJoCo pour réaliser un contrôle prédictif modèle (MPC) en temps réel de robots quadrupèdes et humanoïdes, permettant une généralisation directe du simulateur au monde réel avec peu de considérations de transfert.

John Z. Zhang, Taylor A. Howell, Zeji Yi, Chaoyi Pan, Guanya Shi, Guannan Qu, Tom Erez, Yuval Tassa, Zachary Manchester2026-03-09💻 cs

FindAnything: Open-Vocabulary and Object-Centric Mapping for Robot Exploration in Any Environment

Le papier présente FindAnything, un cadre de cartographie open-vocabulary qui intègre des informations vision-langage dans des sous-cartes volumétriques centrées sur les objets pour permettre une compréhension sémantique précise et économe en ressources, facilitant ainsi l'exploration autonome de grands environnements inconnus par des robots.

Sebastián Barbas Laina, Simon Boche, Sotiris Papatheodorou, Simon Schaefer, Jaehyung Jung, Helen Oleynikova, Stefan Leutenegger2026-03-09🤖 cs.AI

ROS-related Robotic Systems Development with V-model-based Application of MeROS Metamodel

Cet article propose une méthodologie structurée basée sur le méta-modèle MeROS et le modèle en V pour intégrer l'ingénierie système basée sur les modèles (MBSE) au développement de systèmes robotiques complexes utilisant ROS, afin d'améliorer leur cohérence sémantique et leur traçabilité.

Tomasz Winiarski, Jan Kaniuka, Daniel Giełdowski, Jakub Ostrysz, Krystian Radlak, Dmytro Kushnir2026-03-09💻 cs

Diverse and Adaptive Behavior Curriculum for Autonomous Driving: A Student-Teacher Framework with Multi-Agent RL

Cet article propose un cadre innovant d'apprentissage par curriculum automatique pour la conduite autonome, où un agent « enseignant » basé sur l'apprentissage par renforcement multi-agents génère dynamiquement des comportements de trafic variés pour entraîner un agent « étudiant », améliorant ainsi la robustesse et l'équilibre de la conduite par rapport aux méthodes traditionnelles.

Ahmed Abouelazm, Johannes Ratz, Philip Schörner, J. Marius Zöllner2026-03-09🤖 cs.LG

Bridging Simulation and Usability: A User-Friendly Framework for Scenario Generation in CARLA

Ce papier présente un cadre interactif sans code doté d'une interface graphique et d'une représentation par graphes pour faciliter la génération de scénarios de conduite autonome dans CARLA, rendant ainsi la validation par simulation accessible aux utilisateurs non techniques tout en permettant une création manuelle ou automatisée de scénarios diversifiés.

Ahmed Abouelazm, Mohammad Mahmoud, Conrad Walter, Oleksandr Shchetsura, Erne Hussong, Helen Gremmelmaier, J. Marius Zöllner2026-03-09💻 cs

VEGA: Electric Vehicle Navigation Agent via Physics-Informed Neural Operator and Proximal Policy Optimization

Le papier présente VEGA, un agent de navigation pour véhicules électriques qui combine un opérateur neuronal informé par la physique pour estimer les paramètres du véhicule et un algorithme d'apprentissage par renforcement (PPO) pour planifier des itinéraires et des arrêts de recharge optimaux, démontrant une grande efficacité et une capacité de généralisation sur des réseaux routiers internationaux.

Hansol Lim, Minhyeok Im, Jonathan Boyack, Jee Won Lee, Jongseong Brad Choi2026-03-09🤖 cs.LG