Vision-Augmented On-Track System Identification for Autonomous Racing via Attention-Based Priors and Iterative Neural Correction

Cet article propose un cadre novateur d'identification de système pour la course autonome qui combine une estimation de friction basée sur la vision (MobileNetV3) pour un démarrage rapide et un modèle S4 pour capturer les dynamiques temporelles, permettant ainsi une identification précise et rapide des paramètres des pneus Pacejka en réduisant significativement les erreurs d'estimation et la charge de calcul par rapport aux méthodes traditionnelles.

Zhiping Wu, Cheng Hu, Yiqin Wang, Lei Xie, Hongye SuWed, 11 Ma💻 cs

From Flow to One Step: Real-Time Multi-Modal Trajectory Policies via Implicit Maximum Likelihood Estimation-based Distribution Distillation

Cet article propose un cadre de distillation de distribution basé sur l'estimation de vraisemblance maximale implicite (IMLE) qui transforme une politique experte à base de flux conditionnel en une politique étudiante en une seule étape, permettant un contrôle robotique multi-modal en temps réel sans effondrement de la distribution.

Ju Dong, Liding Zhang, Lei Zhang, Yu Fu, Kaixin Bai, Zoltan-Csaba Marton, Zhenshan Bing, Zhaopeng Chen, Alois Christian Knoll, Jianwei ZhangWed, 11 Ma🤖 cs.AI

Open-World Motion Forecasting

Cet article propose un cadre de prévision de mouvement en monde ouvert qui, en s'appuyant sur une stratégie d'apprentissage incrémental de classe combinant étiquetage pseudo et échantillonnage de replay, permet aux véhicules autonomes d'anticiper les trajectoires d'objets directement à partir d'images tout en évitant l'oubli catastrophique et en s'adaptant continuellement à de nouvelles classes d'objets.

Nicolas Schischka, Nikhil Gosala, B Ravi Kiran, Senthil Yogamani, Abhinav ValadaWed, 11 Ma🤖 cs.AI

SEA-Nav: Efficient Policy Learning for Safe and Agile Quadruped Navigation in Cluttered Environments

Ce papier présente SEA-Nav, un cadre d'apprentissage par renforcement qui combine des contraintes de fonctions barrières différentiables, un mécanisme de rejou adaptatif et des contraintes cinématiques pour permettre à des robots quadrupèdes de naviguer de manière sûre et agile dans des environnements encombrés avec un temps d'entraînement de seulement quelques minutes.

Shiyi Chen, Mingye Yang, Haiyan Mao, Jiaqi Zhang, Haiyi Liu, Shuheng He, Debing Zhang, Zihao Qiu, Chun ZhangWed, 11 Ma💻 cs

StyleVLA: Driving Style-Aware Vision Language Action Model for Autonomous Driving

Le papier présente StyleVLA, un modèle d'action vision-langage fondé sur la physique et entraîné sur un jeu de données spécialisé, qui génère des trajectoires de conduite autonomes à la fois physiquement plausibles et adaptées à des styles de conduite variés, surpassant ainsi les modèles propriétaires et les approches actuelles.

Yuan Gao, Dengyuan Hua, Mattia Piccinini, Finn Rasmus Schäfer, Korbinian Moller, Lin Li, Johannes BetzWed, 11 Ma💻 cs

Beyond Short-Horizon: VQ-Memory for Robust Long-Horizon Manipulation in Non-Markovian Simulation Benchmarks

Ce papier présente RuleSafe, un nouveau benchmark de manipulation articulée générant des tâches non markoviennes à long terme, ainsi que VQ-Memory, une méthode de représentation temporelle basée sur des auto-encodeurs variationnels quantifiés vectoriellement qui améliore significativement la planification et la généralisation des modèles d'action vision-langage dans des environnements simulés complexes.

Wang Honghui, Jing Zhi, Ao Jicong, Song Shiji, Li Xuelong, Huang Gao, Bai ChenjiaWed, 11 Ma💻 cs

On the Cost of Evolving Task Specialization in Multi-Robot Systems

Cette étude démontre que, dans le cadre d'un scénario de fourragement avec un budget d'évaluation limité, l'évolution de comportements spécialisés pour des sous-tâches dans des essaims de robots peut échouer à assurer une coopération efficace et se révéler moins performante que des comportements généralistes, remettant ainsi en cause l'avantage systématique de la spécialisation sans analyse coût-bénéfice approfondie.

Paolo Leopardi, Heiko Hamann, Jonas Kuckling, Tanja Katharina KaiserWed, 11 Ma💻 cs

ReTac-ACT: A State-Gated Vision-Tactile Fusion Transformer for Precision Assembly

Le papier présente ReTac-ACT, une politique d'apprentissage par imitation vision-tactile intégrant un mécanisme de fusion bidirectionnel, un réseau de commutation conditionné à la proprioception et un objectif de reconstruction tactile, qui surpasse les méthodes existantes pour atteindre une précision sub-millimétrique dans des tâches d'assemblage complexes malgré les occlusions visuelles.

Minchi Ruan, LiangQing Zhou, Hongtong Li, Zongtao Wang, ZhaoMing Lu, Jianwei Zhang, Bin FangWed, 11 Ma💻 cs

A Generalized Voronoi Graph based Coverage Control Approach for Non-Convex Environment

Cet article propose une approche de contrôle de couverture pour des systèmes multi-robots dans des environnements non convexes, basée sur un graphe de Voronoï généralisé et articulée en deux phases : un algorithme d'équilibrage de charge pondéré pour l'allocation optimale des robots et un contrôleur collaboratif pour la couverture efficace des sous-régions.

Zuyi Guo, Ronghao Zheng, Meiqin Liu, Senlin ZhangWed, 11 Ma💻 cs

OTPL-VIO: Robust Visual-Inertial Odometry with Optimal Transport Line Association and Adaptive Uncertainty

Cet article présente OTPL-VIO, un système de odométrie visuelle-inertielle stéréo robuste qui améliore la précision et la fiabilité dans des environnements à faible texture ou à éclairage variable en associant des segments de ligne via un transport optimal et des descripteurs profonds sans apprentissage, tout en adaptant dynamiquement le poids des contraintes de ligne pour atténuer le bruit de mesure.

Zikun Chen, Wentao Zhao, Yihe Niu, Tianchen Deng, Jingchuan WangWed, 11 Ma💻 cs

DRIFT: Dual-Representation Inter-Fusion Transformer for Automated Driving Perception with 4D Radar Point Clouds

Le papier présente DRIFT, une architecture Transformer à double représentation qui fusionne des caractéristiques locales et globales pour améliorer la détection d'objets et l'estimation de la route libre à partir de nuages de points radar 4D, surpassant ainsi les méthodes existantes sur des ensembles de données publics et internes.

Siqi Pei, Andras Palffy, Dariu M. GavrilaWed, 11 Ma💻 cs

Robotic Scene Cloning:Advancing Zero-Shot Robotic Scene Adaptation in Manipulation via Visual Prompt Editing

Ce papier propose Robotic Scene Cloning (RSC), une nouvelle méthode qui améliore l'adaptation zéro-shot des robots en modifiant les trajectoires d'opérations existantes via une édition visuelle, permettant ainsi une généralisation efficace des tâches dans divers environnements simulés et réels.

Binyuan Huang, Yuqing Wen, Yucheng Zhao, Yaosi Hu, Tiancai Wang, Chang Wen Chen, Haoqiang Fan, Zhenzhong ChenWed, 11 Ma💻 cs