cs.RO articles | Gist.Science

ICLR: In-Context Imitation Learning with Visual Reasoning

Le papier présente ICLR, un cadre novateur d'apprentissage par imitation en contexte qui améliore la robustesse et la généralisation des robots en intégrant des traces de raisonnement visuel structurées pour anticiper les trajectoires futures au sein d'un transformateur autoregressif unifié.

Toan Nguyen, Weiduo Yuan, Songlin Wei, Hui Li, Daniel Seita, Yue Wang2026-03-10💻 cs

ACCURATE: Arbitrary-shaped Continuum Reconstruction Under Robust Adaptive Two-view Estimation

Le papier présente ACCURATE, un cadre de reconstruction 3D robuste et précis pour les corps continus de forme arbitraire, tels que les cathéters, qui combine un réseau de segmentation d'images et un algorithme de programmation dynamique pour garantir une cohérence géométrique biplanaire et atteindre une erreur absolue moyenne inférieure à 1,0 mm.

Yaozhi Zhang, Shun Yu, Yugang Zhang, Yang Liu2026-03-10💻 cs

ReconDrive: Fast Feed-Forward 4D Gaussian Splatting for Autonomous Driving Scene Reconstruction

Le papier présente ReconDrive, un cadre prédictif en une seule passe qui améliore la reconstruction 4D de scènes de conduite autonome en adaptant le modèle de fondation VGGT via des têtes de prédiction hybrides et une composition statique-dynamique, offrant ainsi une qualité compétitive avec les méthodes d'optimisation itérative mais avec une vitesse de traitement bien supérieure.

Haibao Yu, Kuntao Xiao, Jiahang Wang, Ruiyang Hao, Yuxin Huang, Guoran Hu, Haifang Qin, Bowen Jing, Yuntian Bo, Ping Luo2026-03-10💻 cs

Approximate Imitation Learning for Event-based Quadrotor Flight in Cluttered Environments

Cet article présente une méthode d'apprentissage par imitation approximative permettant à un quadrotor de voler à grande vitesse dans des environnements encombrés en utilisant uniquement une caméra événementielle, en contournant le coût computationnel de la simulation d'événements grâce à un apprentissage en ligne basé sur des états simulés légers.

Nico Messikommer, Jiaxu Xing, Leonard Bauersfeld, Marco Cannici, Elie Aljalbout, Davide Scaramuzza2026-03-10💻 cs

FeasibleCap: Real-Time Embodiment Constraint Guidance for In-the-Wild Robot Demonstration Collection

Le papier présente FeasibleCap, un système de collecte de démonstrations robotiques « gripper-in-hand » qui fournit un guidage d'exécutabilité en temps réel via des superpositions visuelles et des retours haptiques, permettant aux démonstrateurs de corriger immédiatement les trajectoires inaccessibles sans nécessiter de matériel robotique ni de modèles appris.

Zi Yin, Fanhong Li, Yun Gui, Jia Liu2026-03-10💻 cs

Model-Based and Neural-Aided Approaches for Dog Dead Reckoning

Cet article présente trois algorithmes de dead reckoning pour chiens (DDR) utilisant uniquement des capteurs inertiels et validés sur des données réelles et robotiques, démontrant que les méthodes assistées par réseaux de neurones surpassent les approches basées sur des modèles pour atteindre une précision de localisation supérieure à 90 %.

Gal Versano. Itai Savin, Itzik Klein2026-03-10💻 cs

SMAT: Staged Multi-Agent Training for Co-Adaptive Exoskeleton Control

Cet article présente SMAT, une méthode d'entraînement multi-agents en quatre étapes qui permet à un exosquelette de hanche de co-s'adapter de manière stable avec l'utilisateur, réduisant ainsi l'activation musculaire de 10,1 % et fournissant une assistance mécanique positive cohérente sans nécessiter de recalibrage spécifique à chaque sujet.

Yifei Yuan, Ghaith Androwis, Xianlian Zhou2026-03-10🤖 cs.LG

GeoLoco: Leveraging 3D Geometric Priors from Visual Foundation Model for Robust RGB-Only Humanoid Locomotion

Le papier présente GeoLoco, un cadre de locomotion pour humanoïdes utilisant uniquement des images RGB, qui exploite les priors géométriques d'un modèle visuel fondationnel figé pour apprendre une politique de contrôle robuste capable d'un transfert zéro-shot réussi du simulateur vers le robot Unitree G1.

Yufei Liu, Xieyuanli Chen, Hainan Pan, Chenghao Shi, Yanjie Chen, Kaihong Huang, Zhiwen Zeng, Huimin Lu2026-03-10💻 cs

Exoskeleton Control through Learning to Reduce Biological Joint Moments in Simulations

Cet article présente un cadre de validation quantitatif pour des contrôleurs d'exosquelette entraînés par apprentissage par renforcement en simulation, démontrant qu'ils peuvent réduire efficacement les moments articulaires biologiques et prédire avec précision les couples d'assistance, tout en soulignant les défis persistants du transfert vers la réalité.

Zihang You, Xianlian Zhou2026-03-10🤖 cs.LG

PanoDP: Learning Collision-Free Navigation with Panoramic Depth and Differentiable Physics

Le papier présente PanoDP, un cadre d'apprentissage sans communication qui combine la perception de profondeur panoramique à quatre vues et des signaux d'entraînement basés sur la physique différentiable pour améliorer la navigation autonome sans collision dans des environnements encombrés et partiellement observables.

Hao Zhong, Pei Chi, Jiang Zhao, Shenghai Yuan, Xuyang Gao, Thien-Minh Nguyen, Lihua Xie2026-03-10💻 cs

TempoFit: Plug-and-Play Layer-Wise Temporal KV Memory for Long-Horizon Vision-Language-Action Manipulation

Le papier présente TempoFit, une méthode d'amélioration sans entraînement des politiques Vision-Language-Action pré-entraînées pour la manipulation à long terme, qui intègre une mémoire temporelle de type FIFO au niveau des couches en réutilisant les clés et valeurs d'attention existantes pour surmonter les limitations des approches sans mémoire.

Jun Sun, Boyu Yang, Jiahao Zhang, Ning Ma, Chencheng Wu, Siqing Zhang, Yiou Huang, Qiufeng Wang, Shan Liang, Yaran Chen2026-03-10💻 cs

AtomicVLA: Unlocking the Potential of Atomic Skill Learning in Robots

Le papier présente AtomicVLA, un cadre unifié de planification et d'exécution qui surpasse les modèles VLA existants en apprenant et en composant dynamiquement des compétences atomiques via un mélange d'experts guidé par les compétences, permettant ainsi une acquisition continue de compétences pour des tâches robotiques à long horizon.

Likui Zhang, Tao Tang, Zhihao Zhan, Xiuwei Chen, Zisheng Chen, Jianhua Han, Jiangtong Zhu, Pei Xu, Hang Xu, Hefeng Wu, Liang Lin, Xiaodan Liang2026-03-10💻 cs

Multi-Agent Off-World Exploration for Sparse Evidence Discovery via Gaussian Belief Mapping and Dual-Domain Coverage

Cet article propose un cadre de planification de trajectoire pour l'exploration multi-robots hors-terre basé sur une cartographie de croyance gaussienne et une couverture à double domaine, permettant de découvrir efficacement des preuves rares dans des environnements dangereux tout en gérant les biais des zones d'intérêt et les contraintes de communication.

Zhuoran Qiao, Tianxin Hu, Thien-Minh Nguyen, Shenghai Yuan2026-03-10💻 cs

DAISS: Phase-Aware Imitation Learning for Dual-Arm Robotic Ultrasound-Guided Interventions

Ce papier présente le DAISS, un système robotique téléopéré à deux bras qui utilise un apprentissage par imitation sensible aux phases pour automatiser de manière précise et coordonnée les interventions guidées par ultrasons, en apprenant des stratégies d'experts à partir de démonstrations limitées.

Feng Li, Pei Liu, Shiting Wang, Ning Wang, Zhongliang Jiang, Nassir Navab, Yuan Bi2026-03-10💻 cs

Low-Cost Teleoperation Extension for Mobile Manipulators

Cet article présente un cadre de téléopération open-source et peu coûteux pour les manipulateurs mobiles bimanuels, utilisant du matériel grand public comme des smartphones et des pédales pour offrir un contrôle intuitif du corps entier tout en réduisant la charge cognitive par rapport aux méthodes traditionnelles.

Danil Belov, Artem Erkhov, Yaroslav Savotin, Tatiana Podladchikova, Pavel Osinenko2026-03-10💻 cs

UniUncer: Unified Dynamic Static Uncertainty for End to End Driving

Le papier présente UniUncer, un cadre léger et unifié qui améliore la fiabilité de la conduite autonome de bout en bout en estimant et en exploitant conjointement les incertitudes statiques et dynamiques pour optimiser la planification.

Yu Gao, Jijun Wang, Zongzheng Zhang, Anqing Jiang, Yiru Wang, Yuwen Heng, Shuo Wang, Hao Sun, Zhangfeng Hu, Hao Zhao2026-03-10💻 cs

RoboPCA: Pose-centered Affordance Learning from Human Demonstrations for Robot Manipulation

Ce papier présente RoboPCA, un cadre d'apprentissage centré sur la pose qui prédit conjointement les régions de contact et les poses d'interaction à partir de démonstrations humaines, en utilisant une pipeline de curation de données nommée Human2Afford pour surmonter les incohérences des méthodes existantes et améliorer la manipulation robotique.

Zhanqi Xiao, Ruiping Wang, Xilin Chen2026-03-10💻 cs

C $^2$ -Explorer: Contiguity-Driven Task Allocation with Connectivity-Aware Task Representation for Decentralized Multi-UAV Exploration

C $^2$ -Explorer est un cadre décentralisé pour l'exploration multi-drones qui améliore l'efficacité de l'allocation des tâches en intégrant la contiguïté spatiale et la connectivité, réduisant ainsi considérablement le temps d'exploration et la longueur des trajectoires par rapport aux méthodes actuelles.

Xinlu Yan, Mingjie Zhang, Yuhao Fang, Yanke Sun, Jun Ma, Youmin Gong, Boyu Zhou, Jie Mei2026-03-10💻 cs

AeroPlace-Flow: Language-Grounded Object Placement for Aerial Manipulators via Visual Foresight and Object Flow

Ce papier présente AeroPlace-Flow, un cadre sans apprentissage qui permet aux manipulateurs aériens d'exécuter des tâches de placement d'objets basées sur des instructions linguistiques en synthétisant des images de but, en les ancrant dans l'espace 3D et en inférant un flux d'objet évitant les collisions.

Sarthak Mishra, Rishabh Dev Yadav, Naveen Nair, Wei Pan, Spandan Roy2026-03-10💻 cs

Directing the Robot: Scaffolding Creative Human-AI-Robot Interaction

Ce papier propose de reconfigurer l'interaction humain-IA-robot comme un processus d'étayage où les humains agissent en tant que directeurs créatifs guidant le comportement robotique, l'IA servant de médiateur pour soutenir l'agence humaine et la créativité plutôt que de se concentrer sur l'autonomie ou l'efficacité.

Jordan Aiko Deja, Isidro Butaslac, Nicko Reginio Caluya, Maheshya Weerasinghe2026-03-10💻 cs

← Précédent Suivant →

cs.RO