cs.RO articles | Gist.Science

STRIDE: Structured Lagrangian and Stochastic Residual Dynamics via Flow Matching

Le papier présente STRIDE, un cadre d'apprentissage dynamique qui sépare la mécanique rigide conservatrice modélisée par un réseau de neurones lagrangien des effets d'interaction stochastiques capturés par l'appariement de flux conditionnel, afin d'améliorer la précision des prédictions et la fiabilité du contrôle pour les robots opérant dans des environnements incertains.

Prakrut Kotecha, Ganga Nair B, Shishir Kolathaya2026-03-10🤖 cs.LG

3PoinTr: 3D Point Tracks for Robot Manipulation Pretraining from Casual Videos

Le papier présente 3PoinTr, une méthode de préentraînement de politiques robotiques à partir de vidéos humaines informelles qui utilise des trajectoires de points 3D comme représentation intermédiaire pour surmonter l'écart d'incarnation et permettre un apprentissage efficace avec un nombre très limité de démonstrations robotiques.

Adam Hung, Bardienus Pieter Duisterhof, Jeffrey Ichnowski2026-03-10💻 cs

The Neural Compass: Probabilistic Relative Feature Fields for Robotic Search

Cet article présente ProReFF, un modèle de champ de caractéristiques probabiliste qui apprend implicitement les co-occurrences d'objets à partir de données non étiquetées pour guider efficacement un agent robotique dans la recherche d'objets, atteignant jusqu'à 80 % des performances humaines.

Gabriele Somaschini, Adrian Röfer, Abhinav Valada2026-03-10🤖 cs.LG

Interactive World Simulator for Robot Policy Training and Evaluation

Les auteurs présentent l'Interactive World Simulator, un cadre utilisant des modèles de cohérence pour générer des simulations robotiques interactives, rapides et physiquement cohérentes, permettant d'entraîner et d'évaluer des politiques d'imitation avec des performances comparables à celles obtenues avec des données réelles.

Yixuan Wang, Rhythm Syed, Fangyu Wu, Mengchao Zhang, Aykut Onol, Jose Barreiros, Hooshang Nayyeri, Tony Dear, Huan Zhang, Yunzhu Li2026-03-10🤖 cs.LG

OA-Bug: An Olfactory-Auditory Augmented Bug Algorithm for Swarm Robots in a Denied Environment

Cet article propose l'algorithme OA-Bug, une méthode d'exploration pour essaims de robots autonomes en environnement dénié qui utilise des signaux olfactifs et auditifs pour atteindre un taux de couverture de 96,93 %, surpassant ainsi significativement l'algorithme SGBA.

Siqi Tan, Xiaoya Zhang, Jingyao Li, Ruitao Jing, Mufan Zhao, Yang Liu, Quan Quan2026-03-09💻 cs

RAG-Driver: Generalisable Driving Explanations with Retrieval-Augmented In-Context Learning in Multi-Modal Large Language Model

Le papier présente RAG-Driver, un modèle de langage multimodal augmenté par la récupération qui utilise l'apprentissage en contexte à partir de démonstrations expertes pour générer des explications de conduite fiables et des prédictions de contrôle, tout en assurant une généralisation exceptionnelle à des environnements non vus sans nécessiter de réentraînement.

Jianhao Yuan, Shuyang Sun, Daniel Omeiza, Bo Zhao, Paul Newman, Lars Kunze, Matthew Gadd2026-03-09🤖 cs.AI

FALCON: Future-Aware Learning with Contextual Object-Centric Pretraining for UAV Action Recognition

Le papier présente FALCON, une méthode d'apprentissage auto-supervisé unifiée pour la reconnaissance d'actions par drone, qui surmonte les déséquilibres spatiaux des vidéos aériennes en intégrant un masquage centré sur les objets et une reconstruction du futur à double horizon pour améliorer la précision et la vitesse d'inférence.

Ruiqi Xian, Xiyang Wu, Tianrui Guan, Xijun Wang, Boqing Gong, Dinesh Manocha2026-03-09🤖 cs.AI

Integrated Hierarchical Decision-Making in Inverse Kinematic Planning and Control

Cet article présente un cadre novateur de programmation non linéaire qui intègre efficacement la prise de décision hiérarchique à la planification et au contrôle cinématiques inverses en exploitant la norme $\ell_0$ pour résoudre des problèmes complexes comme la sélection simultanée de locations d'effecteurs ou de prises bimanuelles.

Kai Pfeiffer, Quan Zhang, Yuqing Chen, Gordon Boateng, Yuquan Wang, Vincent Bonnet, Aberrahmane Kheddar2026-03-09💻 cs

Generative Predictive Control: Flow Matching Policies for Dynamic and Difficult-to-Demonstrate Tasks

Ce papier présente le contrôle prédictif génératif, un cadre d'apprentissage supervisé qui combine la modélisation générative et le contrôle prédictif pour entraîner des politiques de robotique sur des tâches dynamiques difficiles à démontrer mais faciles à simuler, tout en permettant une rétroaction haute fréquence grâce à un amorçage temporel des modèles d'appariement de flux.

Vince Kurtz, Joel W. Burdick2026-03-09🤖 cs.AI

CAPS: Context-Aware Priority Sampling for Enhanced Imitation Learning in Autonomous Driving

Ce papier présente CAPS, une méthode de rééchantillonnage prioritaire contextuel utilisant des VQ-VAE pour équilibrer les données d'apprentissage par imitation et améliorer la généralisation des systèmes de conduite autonome dans le simulateur CARLA.

Hamidreza Mirkhani, Behzad Khamidehi, Ehsan Ahmadi, Mohammed Elmahgiubi, Weize Zhang, Fazel Arasteh, Umar Rajguru, Kasra Rezaee, Dongfeng Bai2026-03-09🤖 cs.LG

Whole-Body Model-Predictive Control of Legged Robots with MuJoCo

Ce papier démontre l'efficacité surprenante d'une approche simple basée sur l'algorithme iLQR couplé à MuJoCo pour réaliser un contrôle prédictif modèle (MPC) en temps réel de robots quadrupèdes et humanoïdes, permettant une généralisation directe du simulateur au monde réel avec peu de considérations de transfert.

John Z. Zhang, Taylor A. Howell, Zeji Yi, Chaoyi Pan, Guanya Shi, Guannan Qu, Tom Erez, Yuval Tassa, Zachary Manchester2026-03-09💻 cs

Graph-based Online Lidar Odometry with Retrospective Map Refinement

Cet article propose une méthode d'odométrie lidar en ligne basée sur un graphe qui améliore la précision et la cohérence à long terme en enregistrant chaque scan sur plusieurs sous-cartes superposées plutôt que sur une carte unique, permettant ainsi un raffinement rétrospectif des points d'ancrage.

Aaron Kurda, Simon Steuernagel, Marcus Baum2026-03-09💻 cs

FindAnything: Open-Vocabulary and Object-Centric Mapping for Robot Exploration in Any Environment

Le papier présente FindAnything, un cadre de cartographie open-vocabulary qui intègre des informations vision-langage dans des sous-cartes volumétriques centrées sur les objets pour permettre une compréhension sémantique précise et économe en ressources, facilitant ainsi l'exploration autonome de grands environnements inconnus par des robots.

Sebastián Barbas Laina, Simon Boche, Sotiris Papatheodorou, Simon Schaefer, Jaehyung Jung, Helen Oleynikova, Stefan Leutenegger2026-03-09🤖 cs.AI

Robustness-Aware Tool Selection and Manipulation Planning with Learned Energy-Informed Guidance

Ce papier présente une méthode de planification de manipulation et de sélection d'outils consciente de la robustesse, guidée par une métrique énergétique apprise, qui optimise conjointement le choix de l'outil et la trajectoire de manipulation pour résister aux perturbations externes.

Yifei Dong, Yan Zhang, Sylvain Calinon, Florian T. Pokorny2026-03-09💻 cs

ROS-related Robotic Systems Development with V-model-based Application of MeROS Metamodel

Cet article propose une méthodologie structurée basée sur le méta-modèle MeROS et le modèle en V pour intégrer l'ingénierie système basée sur les modèles (MBSE) au développement de systèmes robotiques complexes utilisant ROS, afin d'améliorer leur cohérence sémantique et leur traçabilité.

Tomasz Winiarski, Jan Kaniuka, Daniel Giełdowski, Jakub Ostrysz, Krystian Radlak, Dmytro Kushnir2026-03-09💻 cs

Diverse and Adaptive Behavior Curriculum for Autonomous Driving: A Student-Teacher Framework with Multi-Agent RL

Cet article propose un cadre innovant d'apprentissage par curriculum automatique pour la conduite autonome, où un agent « enseignant » basé sur l'apprentissage par renforcement multi-agents génère dynamiquement des comportements de trafic variés pour entraîner un agent « étudiant », améliorant ainsi la robustesse et l'équilibre de la conduite par rapport aux méthodes traditionnelles.

Ahmed Abouelazm, Johannes Ratz, Philip Schörner, J. Marius Zöllner2026-03-09🤖 cs.LG

Bridging Simulation and Usability: A User-Friendly Framework for Scenario Generation in CARLA

Ce papier présente un cadre interactif sans code doté d'une interface graphique et d'une représentation par graphes pour faciliter la génération de scénarios de conduite autonome dans CARLA, rendant ainsi la validation par simulation accessible aux utilisateurs non techniques tout en permettant une création manuelle ou automatisée de scénarios diversifiés.

Ahmed Abouelazm, Mohammad Mahmoud, Conrad Walter, Oleksandr Shchetsura, Erne Hussong, Helen Gremmelmaier, J. Marius Zöllner2026-03-09💻 cs

VEGA: Electric Vehicle Navigation Agent via Physics-Informed Neural Operator and Proximal Policy Optimization

Le papier présente VEGA, un agent de navigation pour véhicules électriques qui combine un opérateur neuronal informé par la physique pour estimer les paramètres du véhicule et un algorithme d'apprentissage par renforcement (PPO) pour planifier des itinéraires et des arrêts de recharge optimaux, démontrant une grande efficacité et une capacité de généralisation sur des réseaux routiers internationaux.

Hansol Lim, Minhyeok Im, Jonathan Boyack, Jee Won Lee, Jongseong Brad Choi2026-03-09🤖 cs.LG

Language Conditioning Improves Accuracy of Aircraft Goal Prediction in Non-Towered Airspace

Cette étude présente un cadre multimodal qui améliore la précision de la prédiction des trajectoires d'aéronefs dans l'espace aérien sans tour de contrôle en fusionnant les communications radio des pilotes avec les données de trajectoire pour alimenter un modèle de prédiction probabiliste.

Sundhar Vinodh Sangeetha, Chih-Yuan Chiu, Sarah H. Q. Li, Shreyas Kousik2026-03-09💻 cs

GLIDE: A Coordinated Aerial-Ground Framework for Search and Rescue in Unknown Environments

Le papier présente GLIDE, un cadre coopératif de recherche et de sauvetage associant deux drones aériens et un véhicule terrestre pour localiser rapidement des victimes et naviguer en toute sécurité dans des environnements inconnus grâce à une séparation des rôles et une planification guidée en temps réel.

Seth Farrell, Chenghao Li, Hesam Mojtahedi, Henrik I. Christensen2026-03-09💻 cs

← Précédent Suivant →