cs.RO articles | Gist.Science

Vision-Augmented On-Track System Identification for Autonomous Racing via Attention-Based Priors and Iterative Neural Correction

Cet article propose un cadre novateur d'identification de système pour la course autonome qui combine une estimation de friction basée sur la vision (MobileNetV3) pour un démarrage rapide et un modèle S4 pour capturer les dynamiques temporelles, permettant ainsi une identification précise et rapide des paramètres des pneus Pacejka en réduisant significativement les erreurs d'estimation et la charge de calcul par rapport aux méthodes traditionnelles.

Zhiping Wu, Cheng Hu, Yiqin Wang, Lei Xie, Hongye SuWed, 11 Ma💻 cs

From Flow to One Step: Real-Time Multi-Modal Trajectory Policies via Implicit Maximum Likelihood Estimation-based Distribution Distillation

Cet article propose un cadre de distillation de distribution basé sur l'estimation de vraisemblance maximale implicite (IMLE) qui transforme une politique experte à base de flux conditionnel en une politique étudiante en une seule étape, permettant un contrôle robotique multi-modal en temps réel sans effondrement de la distribution.

Ju Dong, Liding Zhang, Lei Zhang, Yu Fu, Kaixin Bai, Zoltan-Csaba Marton, Zhenshan Bing, Zhaopeng Chen, Alois Christian Knoll, Jianwei ZhangWed, 11 Ma🤖 cs.AI

Open-World Motion Forecasting

Cet article propose un cadre de prévision de mouvement en monde ouvert qui, en s'appuyant sur une stratégie d'apprentissage incrémental de classe combinant étiquetage pseudo et échantillonnage de replay, permet aux véhicules autonomes d'anticiper les trajectoires d'objets directement à partir d'images tout en évitant l'oubli catastrophique et en s'adaptant continuellement à de nouvelles classes d'objets.

Nicolas Schischka, Nikhil Gosala, B Ravi Kiran, Senthil Yogamani, Abhinav ValadaWed, 11 Ma🤖 cs.AI

Stein Variational Ergodic Surface Coverage with SE(3) Constraints

Cet article présente une méthode de descente de gradient Stein variational préconditionnée sur le groupe SE(3) pour générer des trajectoires robotiques ergodiques optimales couvrant des surfaces 3D complexes tout en respectant rigoureusement les contraintes géométriques de l'end-effector.

Jiayun Li, Yufeng Jin, Sangli Teng, Dejian Gong, Georgia ChalvatzakiWed, 11 Ma💻 cs

SEA-Nav: Efficient Policy Learning for Safe and Agile Quadruped Navigation in Cluttered Environments

Ce papier présente SEA-Nav, un cadre d'apprentissage par renforcement qui combine des contraintes de fonctions barrières différentiables, un mécanisme de rejou adaptatif et des contraintes cinématiques pour permettre à des robots quadrupèdes de naviguer de manière sûre et agile dans des environnements encombrés avec un temps d'entraînement de seulement quelques minutes.

Shiyi Chen, Mingye Yang, Haiyan Mao, Jiaqi Zhang, Haiyi Liu, Shuheng He, Debing Zhang, Zihao Qiu, Chun ZhangWed, 11 Ma💻 cs

Receptogenesis in a Vascularized Robotic Embodiment

Cet article présente un robot vascularisé capable de fabriquer ses propres capteurs de manière autonome par polymérisation photodéclenchée à partir de réserves internes, permettant ainsi une adaptation physique en temps réel et l'émergence de nouveaux comportements.

Kadri-Ann Pankratov, Leonid Zinatullin, Hans Priks, Adele Metsniit, Urmas Johanson, Tarmo Tamm, Alvo Aabloo, Edoardo Sinibaldi, Indrek MustWed, 11 Ma🔬 cond-mat.mtrl-sci

StyleVLA: Driving Style-Aware Vision Language Action Model for Autonomous Driving

Le papier présente StyleVLA, un modèle d'action vision-langage fondé sur la physique et entraîné sur un jeu de données spécialisé, qui génère des trajectoires de conduite autonomes à la fois physiquement plausibles et adaptées à des styles de conduite variés, surpassant ainsi les modèles propriétaires et les approches actuelles.

Yuan Gao, Dengyuan Hua, Mattia Piccinini, Finn Rasmus Schäfer, Korbinian Moller, Lin Li, Johannes BetzWed, 11 Ma💻 cs

Context-Nav: Context-Driven Exploration and Viewpoint-Aware 3D Spatial Reasoning for Instance Navigation

Le papier présente Context-Nav, une méthode sans apprentissage spécifique qui améliore la navigation d'instances en utilisant des alignements texte-image denses pour guider l'exploration globale et une vérification 3D consciente du point de vue pour valider les candidats, atteignant ainsi des performances de pointe sur InstanceNav et CoIN-Bench.

Won Shik Jang, Ue-Hwan KimWed, 11 Ma💻 cs

Beyond Short-Horizon: VQ-Memory for Robust Long-Horizon Manipulation in Non-Markovian Simulation Benchmarks

Ce papier présente RuleSafe, un nouveau benchmark de manipulation articulée générant des tâches non markoviennes à long terme, ainsi que VQ-Memory, une méthode de représentation temporelle basée sur des auto-encodeurs variationnels quantifiés vectoriellement qui améliore significativement la planification et la généralisation des modèles d'action vision-langage dans des environnements simulés complexes.

Wang Honghui, Jing Zhi, Ao Jicong, Song Shiji, Li Xuelong, Huang Gao, Bai ChenjiaWed, 11 Ma💻 cs

NS-VLA: Towards Neuro-Symbolic Vision-Language-Action Models

Ce papier propose NS-VLA, un cadre neuro-symbolique pour les modèles Vision-Language-Action qui combine un encodeur symbolique, un solveur et un apprentissage par renforcement en ligne pour améliorer l'efficacité des données, la généralisation zéro-shot et l'exploration en robotique.

Ziyue Zhu, Shangyang Wu, Shuai Zhao, Zhiqiu Zhao, Shengjie Li, Yi Wang, Fang Li, Haoran LuoWed, 11 Ma💻 cs

On the Cost of Evolving Task Specialization in Multi-Robot Systems

Cette étude démontre que, dans le cadre d'un scénario de fourragement avec un budget d'évaluation limité, l'évolution de comportements spécialisés pour des sous-tâches dans des essaims de robots peut échouer à assurer une coopération efficace et se révéler moins performante que des comportements généralistes, remettant ainsi en cause l'avantage systématique de la spécialisation sans analyse coût-bénéfice approfondie.

Paolo Leopardi, Heiko Hamann, Jonas Kuckling, Tanja Katharina KaiserWed, 11 Ma💻 cs

Trajectory Optimization for Self-Wrap-Aware Cable-Towed Planar Object Manipulation under Implicit Tension Constraints

Cet article propose une méthode d'optimisation de trajectoire pour la manipulation d'objets plans tractés par câble, qui intègre implicitement les contraintes de tension et les phénomènes d'enroulement autonome du câble autour de l'objet pour optimiser la transmission des forces et des couples.

Yu Li, Amin Fakhari, Hamid SadeghianWed, 11 Ma💻 cs

ReTac-ACT: A State-Gated Vision-Tactile Fusion Transformer for Precision Assembly

Le papier présente ReTac-ACT, une politique d'apprentissage par imitation vision-tactile intégrant un mécanisme de fusion bidirectionnel, un réseau de commutation conditionné à la proprioception et un objectif de reconstruction tactile, qui surpasse les méthodes existantes pour atteindre une précision sub-millimétrique dans des tâches d'assemblage complexes malgré les occlusions visuelles.

Minchi Ruan, LiangQing Zhou, Hongtong Li, Zongtao Wang, ZhaoMing Lu, Jianwei Zhang, Bin FangWed, 11 Ma💻 cs

SCDP: Learning Humanoid Locomotion from Partial Observations via Mixed-Observation Distillation

Ce papier présente SCDP, une approche utilisant des politiques de diffusion conditionnées aux capteurs et un entraînement par distillation d'observations mixtes pour permettre une locomotion humanoïde robuste sur un robot réel sans estimation d'état explicite ni capteurs externes.

Milo Carroll, Tianhu Peng, Lingfan Bao, Chengxu Zhou, Zhibin LiWed, 11 Ma🤖 cs.LG

Towards Terrain-Aware Safe Locomotion for Quadrupedal Robots Using Proprioceptive Sensing

Cet article propose un cadre intégrant une estimation de terrain 2,5D à partir de capteurs proprioceptifs et des fonctions barrières de contrôle pour assurer une locomotion sûre et robuste des robots quadrupèdes sur des terrains accidentés.

Peiyu Yang, Jiatao Ding, Wei Pan, Claudio Semini, Cosimo Della SantinaWed, 11 Ma💻 cs

A Generalized Voronoi Graph based Coverage Control Approach for Non-Convex Environment

Cet article propose une approche de contrôle de couverture pour des systèmes multi-robots dans des environnements non convexes, basée sur un graphe de Voronoï généralisé et articulée en deux phases : un algorithme d'équilibrage de charge pondéré pour l'allocation optimale des robots et un contrôleur collaboratif pour la couverture efficace des sous-régions.

Zuyi Guo, Ronghao Zheng, Meiqin Liu, Senlin ZhangWed, 11 Ma💻 cs

OTPL-VIO: Robust Visual-Inertial Odometry with Optimal Transport Line Association and Adaptive Uncertainty

Cet article présente OTPL-VIO, un système de odométrie visuelle-inertielle stéréo robuste qui améliore la précision et la fiabilité dans des environnements à faible texture ou à éclairage variable en associant des segments de ligne via un transport optimal et des descripteurs profonds sans apprentissage, tout en adaptant dynamiquement le poids des contraintes de ligne pour atténuer le bruit de mesure.

Zikun Chen, Wentao Zhao, Yihe Niu, Tianchen Deng, Jingchuan WangWed, 11 Ma💻 cs

DRIFT: Dual-Representation Inter-Fusion Transformer for Automated Driving Perception with 4D Radar Point Clouds

Le papier présente DRIFT, une architecture Transformer à double représentation qui fusionne des caractéristiques locales et globales pour améliorer la détection d'objets et l'estimation de la route libre à partir de nuages de points radar 4D, surpassant ainsi les méthodes existantes sur des ensembles de données publics et internes.

Siqi Pei, Andras Palffy, Dariu M. GavrilaWed, 11 Ma💻 cs

Robotic Scene Cloning:Advancing Zero-Shot Robotic Scene Adaptation in Manipulation via Visual Prompt Editing

Ce papier propose Robotic Scene Cloning (RSC), une nouvelle méthode qui améliore l'adaptation zéro-shot des robots en modifiant les trajectoires d'opérations existantes via une édition visuelle, permettant ainsi une généralisation efficace des tâches dans divers environnements simulés et réels.

Binyuan Huang, Yuqing Wen, Yucheng Zhao, Yaosi Hu, Tiancai Wang, Chang Wen Chen, Haoqiang Fan, Zhenzhong ChenWed, 11 Ma💻 cs

Efficient and robust control with spikes that constrain free energy

Cet article propose un cadre de contrôle par épines neurales novateur et robuste qui implémente le principe de l'énergie libre en limitant le tir des neurones à la réduction de cette énergie, offrant ainsi une efficacité computationnelle élevée et une grande résilience aux perturbations tout en éclairant les mécanismes du contrôle cérébral.

André Urbano, Pablo Lanillos, Sander KeeminkWed, 11 Ma🧬 q-bio

← Précédent Suivant →