cs.RO articles | Gist.Science

A Recipe for Stable Offline Multi-agent Reinforcement Learning

Cet article propose une méthode de normalisation des valeurs invariante à l'échelle (SVN) pour stabiliser l'apprentissage par renforcement multi-agents hors ligne et établit une recette pratique permettant de débloquer son plein potentiel.

Dongsu Lee, Daehee Lee, Amy Zhang2026-03-10🤖 cs.LG

Human-Aware Robot Behaviour in Self-Driving Labs

Cette étude propose une méthode de perception pilotée par l'IA, intégrant un modèle hiérarchique de prédiction des intentions humaines, permettant aux robots mobiles de laboratoires autonomes d'anticiper les interactions et d'optimiser la coordination avec les chercheurs dans des environnements partagés.

Satheeshkumar Veeramani, Anna Kisil, Abigail Bentley, Hatem Fakhruldeen, Gabriella Pizzuto, Andrew I. Cooper2026-03-10💻 cs

Tactile Recognition of Both Shapes and Materials with Automatic Feature Optimization-Enabled Meta Learning

Cet article présente le cadre AFOP-ML, un réseau de type prototypique permettant l'apprentissage méta avec optimisation automatique des caractéristiques, qui améliore considérablement la reconnaissance tactile des formes et des matériaux avec très peu d'exemples en surmontant les défis liés à la rareté des données.

Hongliang Zhao, Wenhui Yang, Yang Chen, Zhuorui Wang, Baiheng Liu, Longhui Qin2026-03-10💻 cs

FoMo: A Multi-Season Dataset for Robot Navigation in Forêt Montmorency

Le jeu de données FoMo, enregistré sur un an dans la forêt Montmorency, offre une collection multi-saisonnière complète de capteurs et de vérité terrain pour évaluer la robustesse des systèmes de navigation robotique face à des changements environnementaux extrêmes comme l'accumulation de neige et la croissance de la végétation.

Matej Boxan, Gabriel Jeanson, Alexander Krawciw, Effie Daum, Xinyuan Qiao, Sven Lilge, Timothy D. Barfoot, François Pomerleau2026-03-10💻 cs

Adaptive Entropy-Driven Sensor Selection in a Camera-LiDAR Particle Filter for Single-Vessel Tracking

Cet article présente un algorithme de suivi maritime adaptatif par filtre particulaire qui fusionne des données caméra et LiDAR en sélectionnant dynamiquement le capteur le plus informatif via une politique de réduction d'entropie, validé par des essais réels à Chypre démontrant une meilleure résilience et un compromis optimal entre précision et continuité.

Andrei Starodubov, Yaqub Aris Prabowo, Andreas Hadjipieris, Ioannis Kyriakides, Roberto Galeazzi2026-03-10🤖 cs.LG

R2F: Repurposing Ray Frontiers for LLM-free Object Navigation

Ce papier propose R2F, un cadre de navigation d'objets en intérieur sans LLM qui repurposant les frontières de rayons pour générer des hypothèses sémantiques directionnelles, permettant ainsi une exécution en temps réel avec des performances compétitives par rapport aux méthodes basées sur des modèles de grande taille.

Francesco Argenziano, John Mark Alexis Marcelo, Michele Brienza, Abdel Hakim Drid, Emanuele Musumeci, Daniele Nardi, Domenico D. Bloisi, Vincenzo Suriani2026-03-10💻 cs

LAR-MoE: Latent-Aligned Routing for Mixture of Experts in Robotic Imitation Learning

Ce papier présente LAR-MoE, un cadre d'apprentissage par imitation en deux étapes qui découvre des compétences de manière non supervisée via un espace latent aligné pour router efficacement des experts spécialisés, permettant ainsi aux robots de maîtriser des tâches dynamiques hétérogènes sans nécessiter d'annotations de phases.

Ariel Rodriguez, Chenpan Li, Lorenzo Mazza, Rayan Younis, Ortrun Hellig, Sebastian Bodenstedt, Martin Wagner, Stefanie Speidel2026-03-10💻 cs

STRIDE: Structured Lagrangian and Stochastic Residual Dynamics via Flow Matching

Le papier présente STRIDE, un cadre d'apprentissage dynamique qui sépare la mécanique rigide conservatrice modélisée par un réseau de neurones lagrangien des effets d'interaction stochastiques capturés par l'appariement de flux conditionnel, afin d'améliorer la précision des prédictions et la fiabilité du contrôle pour les robots opérant dans des environnements incertains.

Prakrut Kotecha, Ganga Nair B, Shishir Kolathaya2026-03-10🤖 cs.LG

3PoinTr: 3D Point Tracks for Robot Manipulation Pretraining from Casual Videos

Le papier présente 3PoinTr, une méthode de préentraînement de politiques robotiques à partir de vidéos humaines informelles qui utilise des trajectoires de points 3D comme représentation intermédiaire pour surmonter l'écart d'incarnation et permettre un apprentissage efficace avec un nombre très limité de démonstrations robotiques.

Adam Hung, Bardienus Pieter Duisterhof, Jeffrey Ichnowski2026-03-10💻 cs

The Neural Compass: Probabilistic Relative Feature Fields for Robotic Search

Cet article présente ProReFF, un modèle de champ de caractéristiques probabiliste qui apprend implicitement les co-occurrences d'objets à partir de données non étiquetées pour guider efficacement un agent robotique dans la recherche d'objets, atteignant jusqu'à 80 % des performances humaines.

Gabriele Somaschini, Adrian Röfer, Abhinav Valada2026-03-10🤖 cs.LG

Interactive World Simulator for Robot Policy Training and Evaluation

Les auteurs présentent l'Interactive World Simulator, un cadre utilisant des modèles de cohérence pour générer des simulations robotiques interactives, rapides et physiquement cohérentes, permettant d'entraîner et d'évaluer des politiques d'imitation avec des performances comparables à celles obtenues avec des données réelles.

Yixuan Wang, Rhythm Syed, Fangyu Wu, Mengchao Zhang, Aykut Onol, Jose Barreiros, Hooshang Nayyeri, Tony Dear, Huan Zhang, Yunzhu Li2026-03-10🤖 cs.LG

OA-Bug: An Olfactory-Auditory Augmented Bug Algorithm for Swarm Robots in a Denied Environment

Cet article propose l'algorithme OA-Bug, une méthode d'exploration pour essaims de robots autonomes en environnement dénié qui utilise des signaux olfactifs et auditifs pour atteindre un taux de couverture de 96,93 %, surpassant ainsi significativement l'algorithme SGBA.

Siqi Tan, Xiaoya Zhang, Jingyao Li, Ruitao Jing, Mufan Zhao, Yang Liu, Quan Quan2026-03-09💻 cs

RAG-Driver: Generalisable Driving Explanations with Retrieval-Augmented In-Context Learning in Multi-Modal Large Language Model

Le papier présente RAG-Driver, un modèle de langage multimodal augmenté par la récupération qui utilise l'apprentissage en contexte à partir de démonstrations expertes pour générer des explications de conduite fiables et des prédictions de contrôle, tout en assurant une généralisation exceptionnelle à des environnements non vus sans nécessiter de réentraînement.

Jianhao Yuan, Shuyang Sun, Daniel Omeiza, Bo Zhao, Paul Newman, Lars Kunze, Matthew Gadd2026-03-09🤖 cs.AI

FALCON: Future-Aware Learning with Contextual Object-Centric Pretraining for UAV Action Recognition

Le papier présente FALCON, une méthode d'apprentissage auto-supervisé unifiée pour la reconnaissance d'actions par drone, qui surmonte les déséquilibres spatiaux des vidéos aériennes en intégrant un masquage centré sur les objets et une reconstruction du futur à double horizon pour améliorer la précision et la vitesse d'inférence.

Ruiqi Xian, Xiyang Wu, Tianrui Guan, Xijun Wang, Boqing Gong, Dinesh Manocha2026-03-09🤖 cs.AI

Integrated Hierarchical Decision-Making in Inverse Kinematic Planning and Control

Cet article présente un cadre novateur de programmation non linéaire qui intègre efficacement la prise de décision hiérarchique à la planification et au contrôle cinématiques inverses en exploitant la norme $\ell_0$ pour résoudre des problèmes complexes comme la sélection simultanée de locations d'effecteurs ou de prises bimanuelles.

Kai Pfeiffer, Quan Zhang, Yuqing Chen, Gordon Boateng, Yuquan Wang, Vincent Bonnet, Aberrahmane Kheddar2026-03-09💻 cs

Generative Predictive Control: Flow Matching Policies for Dynamic and Difficult-to-Demonstrate Tasks

Ce papier présente le contrôle prédictif génératif, un cadre d'apprentissage supervisé qui combine la modélisation générative et le contrôle prédictif pour entraîner des politiques de robotique sur des tâches dynamiques difficiles à démontrer mais faciles à simuler, tout en permettant une rétroaction haute fréquence grâce à un amorçage temporel des modèles d'appariement de flux.

Vince Kurtz, Joel W. Burdick2026-03-09🤖 cs.AI

CAPS: Context-Aware Priority Sampling for Enhanced Imitation Learning in Autonomous Driving

Ce papier présente CAPS, une méthode de rééchantillonnage prioritaire contextuel utilisant des VQ-VAE pour équilibrer les données d'apprentissage par imitation et améliorer la généralisation des systèmes de conduite autonome dans le simulateur CARLA.

Hamidreza Mirkhani, Behzad Khamidehi, Ehsan Ahmadi, Mohammed Elmahgiubi, Weize Zhang, Fazel Arasteh, Umar Rajguru, Kasra Rezaee, Dongfeng Bai2026-03-09🤖 cs.LG

Whole-Body Model-Predictive Control of Legged Robots with MuJoCo

Ce papier démontre l'efficacité surprenante d'une approche simple basée sur l'algorithme iLQR couplé à MuJoCo pour réaliser un contrôle prédictif modèle (MPC) en temps réel de robots quadrupèdes et humanoïdes, permettant une généralisation directe du simulateur au monde réel avec peu de considérations de transfert.

John Z. Zhang, Taylor A. Howell, Zeji Yi, Chaoyi Pan, Guanya Shi, Guannan Qu, Tom Erez, Yuval Tassa, Zachary Manchester2026-03-09💻 cs

Graph-based Online Lidar Odometry with Retrospective Map Refinement

Cet article propose une méthode d'odométrie lidar en ligne basée sur un graphe qui améliore la précision et la cohérence à long terme en enregistrant chaque scan sur plusieurs sous-cartes superposées plutôt que sur une carte unique, permettant ainsi un raffinement rétrospectif des points d'ancrage.

Aaron Kurda, Simon Steuernagel, Marcus Baum2026-03-09💻 cs

FindAnything: Open-Vocabulary and Object-Centric Mapping for Robot Exploration in Any Environment

Le papier présente FindAnything, un cadre de cartographie open-vocabulary qui intègre des informations vision-langage dans des sous-cartes volumétriques centrées sur les objets pour permettre une compréhension sémantique précise et économe en ressources, facilitant ainsi l'exploration autonome de grands environnements inconnus par des robots.

Sebastián Barbas Laina, Simon Boche, Sotiris Papatheodorou, Simon Schaefer, Jaehyung Jung, Helen Oleynikova, Stefan Leutenegger2026-03-09🤖 cs.AI

← Précédent Suivant →