SEA-Nav: Efficient Policy Learning for Safe and Agile Quadruped Navigation in Cluttered Environments

Ce papier présente SEA-Nav, un cadre d'apprentissage par renforcement qui combine des contraintes de fonctions barrières différentiables, un mécanisme de rejou adaptatif et des contraintes cinématiques pour permettre à des robots quadrupèdes de naviguer de manière sûre et agile dans des environnements encombrés avec un temps d'entraînement de seulement quelques minutes.

Shiyi Chen, Mingye Yang, Haiyan Mao, Jiaqi Zhang, Haiyi Liu, Shuheng He, Debing Zhang, Zihao Qiu, Chun Zhang2026-03-11💻 cs

StyleVLA: Driving Style-Aware Vision Language Action Model for Autonomous Driving

Le papier présente StyleVLA, un modèle d'action vision-langage fondé sur la physique et entraîné sur un jeu de données spécialisé, qui génère des trajectoires de conduite autonomes à la fois physiquement plausibles et adaptées à des styles de conduite variés, surpassant ainsi les modèles propriétaires et les approches actuelles.

Yuan Gao, Dengyuan Hua, Mattia Piccinini, Finn Rasmus Schäfer, Korbinian Moller, Lin Li, Johannes Betz2026-03-11💻 cs

Beyond Short-Horizon: VQ-Memory for Robust Long-Horizon Manipulation in Non-Markovian Simulation Benchmarks

Ce papier présente RuleSafe, un nouveau benchmark de manipulation articulée générant des tâches non markoviennes à long terme, ainsi que VQ-Memory, une méthode de représentation temporelle basée sur des auto-encodeurs variationnels quantifiés vectoriellement qui améliore significativement la planification et la généralisation des modèles d'action vision-langage dans des environnements simulés complexes.

Wang Honghui, Jing Zhi, Ao Jicong, Song Shiji, Li Xuelong, Huang Gao, Bai Chenjia2026-03-11💻 cs

On the Cost of Evolving Task Specialization in Multi-Robot Systems

Cette étude démontre que, dans le cadre d'un scénario de fourragement avec un budget d'évaluation limité, l'évolution de comportements spécialisés pour des sous-tâches dans des essaims de robots peut échouer à assurer une coopération efficace et se révéler moins performante que des comportements généralistes, remettant ainsi en cause l'avantage systématique de la spécialisation sans analyse coût-bénéfice approfondie.

Paolo Leopardi, Heiko Hamann, Jonas Kuckling, Tanja Katharina Kaiser2026-03-11💻 cs

ReTac-ACT: A State-Gated Vision-Tactile Fusion Transformer for Precision Assembly

Le papier présente ReTac-ACT, une politique d'apprentissage par imitation vision-tactile intégrant un mécanisme de fusion bidirectionnel, un réseau de commutation conditionné à la proprioception et un objectif de reconstruction tactile, qui surpasse les méthodes existantes pour atteindre une précision sub-millimétrique dans des tâches d'assemblage complexes malgré les occlusions visuelles.

Minchi Ruan, LiangQing Zhou, Hongtong Li, Zongtao Wang, ZhaoMing Lu, Jianwei Zhang, Bin Fang2026-03-11💻 cs

A Generalized Voronoi Graph based Coverage Control Approach for Non-Convex Environment

Cet article propose une approche de contrôle de couverture pour des systèmes multi-robots dans des environnements non convexes, basée sur un graphe de Voronoï généralisé et articulée en deux phases : un algorithme d'équilibrage de charge pondéré pour l'allocation optimale des robots et un contrôleur collaboratif pour la couverture efficace des sous-régions.

Zuyi Guo, Ronghao Zheng, Meiqin Liu, Senlin Zhang2026-03-11💻 cs

OTPL-VIO: Robust Visual-Inertial Odometry with Optimal Transport Line Association and Adaptive Uncertainty

Cet article présente OTPL-VIO, un système de odométrie visuelle-inertielle stéréo robuste qui améliore la précision et la fiabilité dans des environnements à faible texture ou à éclairage variable en associant des segments de ligne via un transport optimal et des descripteurs profonds sans apprentissage, tout en adaptant dynamiquement le poids des contraintes de ligne pour atténuer le bruit de mesure.

Zikun Chen, Wentao Zhao, Yihe Niu, Tianchen Deng, Jingchuan Wang2026-03-11💻 cs

DRIFT: Dual-Representation Inter-Fusion Transformer for Automated Driving Perception with 4D Radar Point Clouds

Le papier présente DRIFT, une architecture Transformer à double représentation qui fusionne des caractéristiques locales et globales pour améliorer la détection d'objets et l'estimation de la route libre à partir de nuages de points radar 4D, surpassant ainsi les méthodes existantes sur des ensembles de données publics et internes.

Siqi Pei, Andras Palffy, Dariu M. Gavrila2026-03-11💻 cs

Robotic Scene Cloning:Advancing Zero-Shot Robotic Scene Adaptation in Manipulation via Visual Prompt Editing

Ce papier propose Robotic Scene Cloning (RSC), une nouvelle méthode qui améliore l'adaptation zéro-shot des robots en modifiant les trajectoires d'opérations existantes via une édition visuelle, permettant ainsi une généralisation efficace des tâches dans divers environnements simulés et réels.

Binyuan Huang, Yuqing Wen, Yucheng Zhao, Yaosi Hu, Tiancai Wang, Chang Wen Chen, Haoqiang Fan, Zhenzhong Chen2026-03-11💻 cs

M2M^2-Occ: Resilient 3D Semantic Occupancy Prediction for Autonomous Driving with Incomplete Camera Inputs

Ce papier présente M2M^2-Occ, un cadre innovant pour la prédiction d'occupation sémantique 3D qui assure une robustesse face aux entrées de caméras incomplètes grâce à une reconstruction masquée multi-vues et un module de mémoire de caractéristiques, améliorant ainsi significativement la précision dans des scénarios de défaillance critique.

Kaixin Lin, Kunyu Peng, Di Wen, Yufan Chen, Ruiping Liu, Kailun Yang2026-03-11⚡ eess

PanoAffordanceNet: Towards Holistic Affordance Grounding in 360{\deg} Indoor Environments

Ce papier présente PanoAffordanceNet, un cadre novateur et un nouveau jeu de données 360-AGD conçus pour résoudre les défis de l'ancrage holistique des affordances dans les environnements intérieurs panoramiques en surmontant les distorsions géométriques et la dispersion sémantique grâce à des mécanismes de calibration et de densification spécifiques.

Guoliang Zhu, Wanjun Jia, Caoyang Shao, Yuheng Zhang, Zhiyong Li, Kailun Yang2026-03-11⚡ eess