ACCURATE: Arbitrary-shaped Continuum Reconstruction Under Robust Adaptive Two-view Estimation

Le papier présente ACCURATE, un cadre de reconstruction 3D robuste et précis pour les corps continus de forme arbitraire, tels que les cathéters, qui combine un réseau de segmentation d'images et un algorithme de programmation dynamique pour garantir une cohérence géométrique biplanaire et atteindre une erreur absolue moyenne inférieure à 1,0 mm.

Yaozhi Zhang, Shun Yu, Yugang Zhang, Yang Liu2026-03-10💻 cs

ReconDrive: Fast Feed-Forward 4D Gaussian Splatting for Autonomous Driving Scene Reconstruction

Le papier présente ReconDrive, un cadre prédictif en une seule passe qui améliore la reconstruction 4D de scènes de conduite autonome en adaptant le modèle de fondation VGGT via des têtes de prédiction hybrides et une composition statique-dynamique, offrant ainsi une qualité compétitive avec les méthodes d'optimisation itérative mais avec une vitesse de traitement bien supérieure.

Haibao Yu, Kuntao Xiao, Jiahang Wang, Ruiyang Hao, Yuxin Huang, Guoran Hu, Haifang Qin, Bowen Jing, Yuntian Bo, Ping Luo2026-03-10💻 cs

Approximate Imitation Learning for Event-based Quadrotor Flight in Cluttered Environments

Cet article présente une méthode d'apprentissage par imitation approximative permettant à un quadrotor de voler à grande vitesse dans des environnements encombrés en utilisant uniquement une caméra événementielle, en contournant le coût computationnel de la simulation d'événements grâce à un apprentissage en ligne basé sur des états simulés légers.

Nico Messikommer, Jiaxu Xing, Leonard Bauersfeld, Marco Cannici, Elie Aljalbout, Davide Scaramuzza2026-03-10💻 cs

FeasibleCap: Real-Time Embodiment Constraint Guidance for In-the-Wild Robot Demonstration Collection

Le papier présente FeasibleCap, un système de collecte de démonstrations robotiques « gripper-in-hand » qui fournit un guidage d'exécutabilité en temps réel via des superpositions visuelles et des retours haptiques, permettant aux démonstrateurs de corriger immédiatement les trajectoires inaccessibles sans nécessiter de matériel robotique ni de modèles appris.

Zi Yin, Fanhong Li, Yun Gui, Jia Liu2026-03-10💻 cs

GeoLoco: Leveraging 3D Geometric Priors from Visual Foundation Model for Robust RGB-Only Humanoid Locomotion

Le papier présente GeoLoco, un cadre de locomotion pour humanoïdes utilisant uniquement des images RGB, qui exploite les priors géométriques d'un modèle visuel fondationnel figé pour apprendre une politique de contrôle robuste capable d'un transfert zéro-shot réussi du simulateur vers le robot Unitree G1.

Yufei Liu, Xieyuanli Chen, Hainan Pan, Chenghao Shi, Yanjie Chen, Kaihong Huang, Zhiwen Zeng, Huimin Lu2026-03-10💻 cs

PanoDP: Learning Collision-Free Navigation with Panoramic Depth and Differentiable Physics

Le papier présente PanoDP, un cadre d'apprentissage sans communication qui combine la perception de profondeur panoramique à quatre vues et des signaux d'entraînement basés sur la physique différentiable pour améliorer la navigation autonome sans collision dans des environnements encombrés et partiellement observables.

Hao Zhong, Pei Chi, Jiang Zhao, Shenghai Yuan, Xuyang Gao, Thien-Minh Nguyen, Lihua Xie2026-03-10💻 cs

TempoFit: Plug-and-Play Layer-Wise Temporal KV Memory for Long-Horizon Vision-Language-Action Manipulation

Le papier présente TempoFit, une méthode d'amélioration sans entraînement des politiques Vision-Language-Action pré-entraînées pour la manipulation à long terme, qui intègre une mémoire temporelle de type FIFO au niveau des couches en réutilisant les clés et valeurs d'attention existantes pour surmonter les limitations des approches sans mémoire.

Jun Sun, Boyu Yang, Jiahao Zhang, Ning Ma, Chencheng Wu, Siqing Zhang, Yiou Huang, Qiufeng Wang, Shan Liang, Yaran Chen2026-03-10💻 cs

AtomicVLA: Unlocking the Potential of Atomic Skill Learning in Robots

Le papier présente AtomicVLA, un cadre unifié de planification et d'exécution qui surpasse les modèles VLA existants en apprenant et en composant dynamiquement des compétences atomiques via un mélange d'experts guidé par les compétences, permettant ainsi une acquisition continue de compétences pour des tâches robotiques à long horizon.

Likui Zhang, Tao Tang, Zhihao Zhan, Xiuwei Chen, Zisheng Chen, Jianhua Han, Jiangtong Zhu, Pei Xu, Hang Xu, Hefeng Wu, Liang Lin, Xiaodan Liang2026-03-10💻 cs

Multi-Agent Off-World Exploration for Sparse Evidence Discovery via Gaussian Belief Mapping and Dual-Domain Coverage

Cet article propose un cadre de planification de trajectoire pour l'exploration multi-robots hors-terre basé sur une cartographie de croyance gaussienne et une couverture à double domaine, permettant de découvrir efficacement des preuves rares dans des environnements dangereux tout en gérant les biais des zones d'intérêt et les contraintes de communication.

Zhuoran Qiao, Tianxin Hu, Thien-Minh Nguyen, Shenghai Yuan2026-03-10💻 cs

DAISS: Phase-Aware Imitation Learning for Dual-Arm Robotic Ultrasound-Guided Interventions

Ce papier présente le DAISS, un système robotique téléopéré à deux bras qui utilise un apprentissage par imitation sensible aux phases pour automatiser de manière précise et coordonnée les interventions guidées par ultrasons, en apprenant des stratégies d'experts à partir de démonstrations limitées.

Feng Li, Pei Liu, Shiting Wang, Ning Wang, Zhongliang Jiang, Nassir Navab, Yuan Bi2026-03-10💻 cs

RoboPCA: Pose-centered Affordance Learning from Human Demonstrations for Robot Manipulation

Ce papier présente RoboPCA, un cadre d'apprentissage centré sur la pose qui prédit conjointement les régions de contact et les poses d'interaction à partir de démonstrations humaines, en utilisant une pipeline de curation de données nommée Human2Afford pour surmonter les incohérences des méthodes existantes et améliorer la manipulation robotique.

Zhanqi Xiao, Ruiping Wang, Xilin Chen2026-03-10💻 cs

C2^2-Explorer: Contiguity-Driven Task Allocation with Connectivity-Aware Task Representation for Decentralized Multi-UAV Exploration

C2^2-Explorer est un cadre décentralisé pour l'exploration multi-drones qui améliore l'efficacité de l'allocation des tâches en intégrant la contiguïté spatiale et la connectivité, réduisant ainsi considérablement le temps d'exploration et la longueur des trajectoires par rapport aux méthodes actuelles.

Xinlu Yan, Mingjie Zhang, Yuhao Fang, Yanke Sun, Jun Ma, Youmin Gong, Boyu Zhou, Jie Mei2026-03-10💻 cs

AeroPlace-Flow: Language-Grounded Object Placement for Aerial Manipulators via Visual Foresight and Object Flow

Ce papier présente AeroPlace-Flow, un cadre sans apprentissage qui permet aux manipulateurs aériens d'exécuter des tâches de placement d'objets basées sur des instructions linguistiques en synthétisant des images de but, en les ancrant dans l'espace 3D et en inférant un flux d'objet évitant les collisions.

Sarthak Mishra, Rishabh Dev Yadav, Naveen Nair, Wei Pan, Spandan Roy2026-03-10💻 cs