cs.RO articles | Gist.Science

PanoAffordanceNet: Towards Holistic Affordance Grounding in 360{\deg} Indoor Environments

Ce papier présente PanoAffordanceNet, un cadre novateur et un nouveau jeu de données 360-AGD conçus pour résoudre les défis de l'ancrage holistique des affordances dans les environnements intérieurs panoramiques en surmontant les distorsions géométriques et la dispersion sémantique grâce à des mécanismes de calibration et de densification spécifiques.

Guoliang Zhu, Wanjun Jia, Caoyang Shao, Yuheng Zhang, Zhiyong Li, Kailun Yang2026-03-11⚡ eess

MuxGel: Simultaneous Dual-Modal Visuo-Tactile Sensing via Spatially Multiplexing and Deep Reconstruction

Le papier présente MuxGel, un capteur tactile visuel à haute fidélité qui surmonte le compromis traditionnel entre vision et toucher en utilisant un motif de damier pour multiplexer spatialement les signaux, permettant ainsi la récupération simultanée d'informations visuelles externes et de données tactiles via une seule caméra et un cadre de reconstruction profond.

Zhixian Hu, Zhengtong Xu, Sheeraz Athar, Juan Wachs, Yu She2026-03-11💻 cs

TIMID: Time-Dependent Mistake Detection in Videos of Robot Executions

Ce papier présente TIMID, une nouvelle architecture de détection d'anomalies vidéo capable d'identifier des erreurs temporelles dans les exécutions de robots grâce à une supervision faible et à une évaluation sim-to-real sur un jeu de données multi-robots.

Nerea Gallego (University of Zaragoza), Fernando Salanova (University of Zaragoza), Claudio Mannarano (University of Zaragoza, University of Torino), Cristian Mahulea (University of Zaragoza), Eduardo Montijano (University of Zaragoza)2026-03-11💻 cs

Lightweight 3D LiDAR-Based UAV Tracking: An Adaptive Extended Kalman Filtering Approach

Cet article présente un système de suivi de drones léger basé sur le LiDAR 3D, utilisant un filtre de Kalman étendu adaptatif pour assurer un positionnement relatif robuste et précis dans des environnements sans GPS, même avec des données de nuage de points éparses et bruitées.

Nivand Khosravi, Meysam Basiri, Rodrigo Ventura2026-03-11⚡ eess

Emerging Extrinsic Dexterity in Cluttered Scenes via Dynamics-aware Policy Learning

Cet article présente le cadre DAPL, une méthode d'apprentissage par renforcement qui modélise explicitement les dynamiques induites par les contacts pour permettre à un robot d'acquérir une dextérité extrinsèque efficace dans des scènes encombrées, surpassant ainsi les approches existantes tant en simulation que dans le monde réel.

Yixin Zheng, Jiangran Lyu, Yifan Zhang, Jiayi Chen, Mi Yan, Yuntian Deng, Xuesong Shi, Xiaoguang Zhao, Yizhou Wang, Zhizheng Zhang, He Wang2026-03-11🤖 cs.AI

Robust Cooperative Localization in Featureless Environments: A Comparative Study of DCL, StCL, CCL, CI, and Standard-CL

Cette étude comparative évalue cinq approches de localisation coopérative en environnements sans caractéristiques, révélant que la méthode CI offre le meilleur équilibre entre précision et cohérence, tandis que les méthodes StCL et Standard-CL, bien que plus précises, souffrent d'incohérences critiques pour les applications de sécurité.

Nivand Khosravi, Meysam Basiri, Rodrigo Ventura2026-03-11💻 cs

NanoBench: A Multi-Task Benchmark Dataset for Nano-Quadrotor System Identification, Control, and State Estimation

Ce papier présente NanoBench, un nouveau jeu de données open-source et multi-tâches collecté sur un nano-quadrirotor Crazyflie 2.1, qui fournit des signaux de niveau actionneur et un état de référence précis pour faciliter l'identification de systèmes, le contrôle et l'estimation d'état à l'échelle nanométrique.

Syed Izzat Ullah, Jose Baca2026-03-11⚡ eess

Kinodynamic Motion Retargeting for Humanoid Locomotion via Multi-Contact Whole-Body Trajectory Optimization

Ce papier présente KDMR, un cadre novateur de rétargeting de mouvement cinodynamique qui, en formulant le problème comme une optimisation de trajectoire corporelle entière à contacts multiples intégrant la dynamique des corps rigides et les forces de réaction au sol, génère des trajectoires de locomotion pour humanoïdes physiquement cohérentes et supérieures aux méthodes cinématiques traditionnelles pour l'apprentissage par imitation.

Xiaoyu Zhang, Steven Haener, Varun Madabushi, Maegan Tucker2026-03-11💻 cs

BEACON: Language-Conditioned Navigation Affordance Prediction under Occlusion

Le papier propose BEACON, une méthode qui améliore la navigation robotique conditionnée par le langage en présence d'obstacles en prédisant une carte de chaleur d'affordance en vue aérienne (BEV) à partir d'observations RGB-D et d'instructions textuelles, surpassant ainsi les approches basées sur l'espace image pour localiser des cibles occluses.

Xinyu Gao, Gang Chen, Javier Alonso-Mora2026-03-11🤖 cs.AI

TiPToP: A Modular Open-Vocabulary Planning System for Robotic Manipulation

Le papier présente TiPToP, un système de planification modulaire et open-vocabulary qui combine des modèles de vision préentraînés avec un planificateur TAMP pour exécuter des tâches de manipulation robotique complexes à partir d'images et d'instructions naturelles, surpassant ou égalant les performances d'un modèle VLA entraîné sur des données spécifiques sans nécessiter aucune donnée robotique.

William Shen, Nishanth Kumar, Sahit Chintalapudi, Jie Wang, Christopher Watson, Edward Hu, Jing Cao, Dinesh Jayaraman, Leslie Pack Kaelbling, Tomás Lozano-Pérez2026-03-11💻 cs

Utility Theory based Cognitive Modeling in the Application of Robotics: A Survey

Cette étude de synthèse examine l'application de la théorie de l'utilité au modèle cognitif en robotique, en retraçant son évolution depuis la robotique basée sur le comportement jusqu'aux systèmes de valeurs actuels, tout en identifiant les défis ouverts et les perspectives de recherche pour les systèmes mono et multi-agents.

Qin Yang2026-03-10💻 cs

Influence-Based Reward Modulation for Implicit Communication in Human-Robot Interaction

Cet article propose une méthode de modulation des récompenses basée sur l'influence, utilisant l'entropie de transfert pour favoriser la communication implicite et améliorer la collaboration ou l'autonomie sociale entre robots et humains dans des scénarios de navigation et de conduite autonome.

Haoyang Jiang, Elizabeth A. Croft, Michael G. Burke2026-03-10💻 cs

Input-to-State Stable Coupled Oscillator Networks for Closed-form Model-based Control in Latent Space

Cet article propose un réseau d'oscillateurs couplés (CON) qui modélise la dynamique des systèmes physiques dans un espace latent sous forme lagrangienne avec une stabilité prouvée, permettant ainsi un contrôle basé sur des modèles en boucle fermée performant utilisant uniquement des images brutes.

Maximilian Stölzle, Cosimo Della Santina2026-03-10🤖 cs.LG

xTED: Cross-Domain Adaptation via Diffusion-Based Trajectory Editing

Le papier présente xTED, un cadre innovant utilisant un modèle de diffusion pour adapter directement les trajectoires d'un domaine source à un domaine cible, comblant ainsi les écarts de domaine au niveau des données tout en préservant le sens sémantique et en facilitant l'apprentissage de politiques sans nécessiter d'architectures complexes.

Haoyi Niu, Qimao Chen, Tenglong Liu, Jianxiong Li, Guyue Zhou, Yi Zhang, Jianming Hu, Xianyuan Zhan2026-03-10🤖 cs.LG

Variational approach to nonholonomic and inequality-constrained mechanics

Cet article propose une formulation variationnelle générale et explicite pour les systèmes mécaniques non holonomes et à contraintes d'inégalité, inspirée de l'action de Schwinger-Keldysh, qui permet de retrouver les équations de Lagrange-d'Alembert par l'extremisation d'une action scalaire et d'optimiser directement les trajectoires sans passer par les équations du mouvement.

A. Rothkopf, W. A. Horowitz2026-03-10🔢 math

Optimizing Locomotor Task Sets in Biological Joint Moment Estimation for Hip Exoskeleton Applications

Cette étude propose une stratégie d'optimisation des tâches locomotrices basée sur l'analyse de clusters pour identifier un ensemble minimal de tâches permettant d'estimer avec précision les moments articulaires de la hanche à l'aide de réseaux de neurones, réduisant ainsi considérablement le besoin en données de collecte tout en maintenant des performances comparables à celles obtenues avec un ensemble complet de tâches.

Jimin An, Changseob Song, Eni Halilaj + 1 more2026-03-10🤖 cs.LG

Energy-Efficient SLAM via Joint Design of Sensing, Communication, and Exploration Speed

Cet article propose une méthode d'optimisation conjointe de la durée de détection, de la puissance d'émission, de la durée de transmission et de la vitesse d'exploration pour minimiser la consommation énergétique des robots mobiles effectuant une SLAM à long terme avec reconstruction de carte en temps réel par apprentissage profond.

Zidong Han, Ruibo Jin, Xiaoyang Li + 3 more2026-03-10🤖 cs.AI

From Pixels to Predicates: Learning Symbolic World Models via Pretrained Vision-Language Models

Cet article propose une méthode permettant d'apprendre des modèles du monde symboliques abstraits à partir de démonstrations visuelles et de modèles vision-langage préentraînés, afin de résoudre par planification des tâches de prise de décision à long horizon dans des environnements robotiques complexes avec une généralisation zéro-shot.

Ashay Athalye, Nishanth Kumar, Tom Silver, Yichao Liang, Jiuguang Wang, Tomás Lozano-Pérez, Leslie Pack Kaelbling2026-03-10🤖 cs.LG

Strengthening Generative Robot Policies through Predictive World Modeling

Ce papier présente la commande prédictive générative (GPC), un cadre d'apprentissage qui combine un clone de politique générative, un modèle du monde prédictif et un planificateur en ligne pour surpasser le clonage comportemental dans diverses tâches de manipulation robotique, tant en simulation que dans le monde réel.

Han Qi, Haocheng Yin, Aris Zhu, Yilun Du, Heng Yang2026-03-10🤖 cs.LG

ViLAM: Distilling Vision-Language Reasoning into Attention Maps for Social Robot Navigation

Le papier présente ViLAM, une méthode novatrice qui distille le raisonnement vision-langage de grands modèles dans des cartes d'attention spatiale pour guider la navigation de robots sociaux, démontrant ainsi une amélioration significative du taux de réussite par rapport aux méthodes existantes lors d'expériences réelles.

Mohamed Elnoor, Kasun Weerakoon, Gershom Seneviratne, Jing Liang, Vignesh Rajagopal, Dinesh Manocha2026-03-10💻 cs

← Précédent Suivant →