cs.RO articles | Gist.Science

Proprioceptive Shape Estimation of Tensegrity Manipulators Using Energy Minimisation

Cet article présente une méthode de reconstruction de la forme d'un manipulateur à tensegrité à grande échelle utilisant uniquement les angles d'inclinaison mesurés par des IMU et une minimisation d'énergie, démontrant une précision de 2,1 % de la longueur totale en conditions statiques et sous perturbations.

Tufail Ahmad Bhat, Shuhei Ikemoto2026-03-09💻 cs

HarvestFlex: Strawberry Harvesting via Vision-Language-Action Policy Adaptation in the Wild

Cette étude présente HarvestFlex, le premier système à transférer des politiques vision-langage-action vers la récolte réelle de fraises en serre, atteignant un taux de réussite de 74 % grâce à une adaptation de modèle sur seulement 3,71 heures de données téléopérées et une architecture de perception RGB sans calibration géométrique explicite.

Ziyang Zhao, Shuheng Wang, Zhonghua Miao, Ya Xiong2026-03-09💻 cs

MagRobot:An Open Simulator for Magnetically Navigated Robots

Le papier présente MagRobot, le premier simulateur open-source universel conçu pour faciliter la conception, la visualisation et l'évaluation comparative des robots navigués par aimant dans des applications médicales minimales invasives, en offrant un environnement flexible pour tester des algorithmes et des configurations matérielles variées dans des anatomies déformables.

Heng Wang (South China University of Technology), Haoyu Song (South China University of Technology), Jiatao Zheng (South China University of Technology), Yuxiang Han (South China University of Technology), Kunli Wang (South China University of Technology)2026-03-09💻 cs

Moving Through Clutter: Scaling Data Collection and Benchmarking for 3D Scene-Aware Humanoid Locomotion via Virtual Reality

Ce papier présente « Moving Through Clutter », un cadre open-source basé sur la réalité virtuelle pour la collecte de données et l'évaluation de la locomotion de humanoïdes dans des environnements 3D encombrés, incluant un jeu de données de 348 trajectoires et des benchmarks pour étudier l'adaptation aux contraintes géométriques.

Beichen Wang, Yuanjie Lu, Linji Wang, Liuchuan Yu, Xuesu Xiao2026-03-09💻 cs

TADPO: Reinforcement Learning Goes Off-road

Le papier présente TADPO, une nouvelle méthode d'apprentissage par renforcement basée sur PPO qui permet pour la première fois le transfert sim-to-real zéro-shot d'un véhicule tout-terrain à échelle réelle capable de naviguer à haute vitesse sur des terrains non cartographiés et accidentés.

Zhouchonghao Wu, Raymond Song, Vedant Mundheda, Luis E. Navarro-Serment, Christof Schoenborn, Jeff Schneider2026-03-09🤖 cs.AI

Restoring Linguistic Grounding in VLA Models via Train-Free Attention Recalibration

Cet article présente IGAR, une méthode d'inférence sans réentraînement qui corrige la « cécité linguistique » des modèles VLA en recalibrant leur attention pour rétablir la primauté des instructions textuelles sur les biais visuels lors de la génération d'actions robotiques.

Ninghao Zhang, Bin Zhu, Shijie Zhou, Jingjing Chen2026-03-09🤖 cs.AI

Devil is in Narrow Policy: Unleashing Exploration in Driving VLA Models

Le papier propose Curious-VLA, un cadre en deux étapes intégrant l'expansion de trajectoires faisables et un échantillonnage adaptatif pour surmonter les limitations des politiques étroites dans les modèles VLA de conduite autonome et atteindre des performances record sur le benchmark Navsim.

Canyu Chen, Yuguang Yang, Zhewen Tan, Yizhi Wang, Ruiyi Zhan, Haiyan Liu, Xuanyao Mao, Jason Bao, Xinyue Tang, Linlin Yang, Bingchuan Sun, Yan Wang, Baochang Zhang2026-03-09💻 cs

RODEO: RObotic DEcentralized Organization

Ce papier présente RODEO, un cadre basé sur la blockchain qui formalise des organisations autonomes décentralisées pour les robots de service en intégrant des mécanismes de confiance, d'auditabilité et de paiement en tokens, permettant ainsi à un robot expérimental de financer son autonomie opérationnelle grâce à la validation de ses tâches.

Milan Groshev, Eduardo Castelló Ferrer2026-03-09💻 cs

Transforming Omnidirectional RGB-LiDAR data into 3D Gaussian Splatting

Cet article présente un pipeline innovant qui transforme des logs archivés de capteurs omnidirectionnels RGB-LiDAR en initialisations robustes pour le 3D Gaussian Splatting, permettant ainsi de générer des jumeaux numériques de haute qualité sans nécessiter de collecte de données coûteuse.

Semin Bae, Hansol Lim, Jongseong Brad Choi2026-03-09💻 cs

Lifelong Embodied Navigation Learning

Ce papier présente Uni-Walker, un cadre d'apprentissage perpétuel pour la navigation incarnée qui utilise le mécanisme DE-LoRA pour découpler les connaissances partagées et spécifiques, permettant ainsi aux agents d'acquérir continuellement de nouvelles compétences de navigation sans oublier les précédentes.

Xudong Wang, Jiahua Dong, Baichen Liu, Qi Lyu, Lianqing Liu, Zhi Han2026-03-09🤖 cs.AI

Multimodal Behavior Tree Generation: A Small Vision-Language Model for Robot Task Planning

Cet article présente une méthode utilisant un petit modèle vision-langage (VLM) de 4 milliards de paramètres, affiné sur un nouveau dataset généré à partir d'épisodes robotiques, pour produire des arbres de comportement exécutables qui atteignent un taux de réussite de 87 % dans des tâches ménagères simulées, rivalisant ainsi avec des modèles fermés beaucoup plus coûteux.

Cristiano Battistini, Riccardo Andrea Izzo, Gianluca Bardaro, Matteo Matteucci2026-03-09💻 cs

Sticky-Glance: Robust Intent Recognition for Human Robot Collaboration via Single-Glance

Ce papier propose « Sticky-Glance », un cadre de reconnaissance d'intention robuste pour la collaboration humain-robot qui stabilise le suivi des regards vers des objets grâce à un algorithme « sticky-glance » et à une interaction multimodale, permettant une sélection précise avec très peu d'échantillons et réduisant la durée des tâches de près de 10 %.

Yuzhi Lai, Shenghai Yuan, Peizheng Li, Andreas Zell2026-03-09💻 cs

A Hazard-Informed Data Pipeline for Robotics Physical Safety

Ce rapport présente un cadre structuré pour la sécurité physique des robots qui aligne l'ingénierie de sécurité classique, la simulation de jumeaux numériques et la génération de données synthétiques pour entraîner des modèles d'apprentissage machine fondés sur une ontologie formalisée des dangers.

Alexei Odinokov, Rostislav Yavorskiy2026-03-09🤖 cs.AI

Dual-Agent Multiple-Model Reinforcement Learning for Event-Triggered Human-Robot Co-Adaptation in Decoupled Task Spaces

Cet article présente une politique de contrôle partagé pour la rééducation, baptisée DAMMRL, qui utilise un apprentissage par renforcement à double agent et à modèles multiples pour optimiser l'adaptation conjointe humain-robot dans des tâches de rééducation du membre supérieur en déclenchant les actions de manière événementielle et en découplant les espaces de tâche afin de supprimer les oscillations et d'améliorer l'efficacité.

Yaqi Li, Zhengqi Han, Huifang Liu, Steven W. Su2026-03-09💻 cs

DreamToNav: Generalizable Navigation for Robots via Generative Video Planning

Le papier présente DreamToNav, un cadre de navigation robotique généralisable qui utilise des modèles de génération vidéo pour transformer des instructions naturelles en trajectoires exécutables, permettant ainsi à des robots de « rêver » visuellement leurs mouvements avant l'exécution avec un taux de réussite de 76,7 %.

Valerii Serpiva, Jeffrin Sam, Chidera Simon, Hajira Amjad, Iana Zhura, Artem Lykov, Dzmitry Tsetserukou2026-03-09💻 cs

KISS-IMU: Self-supervised Inertial Odometry with Motion-balanced Learning and Uncertainty-aware Inference

Le papier présente KISS-IMU, un cadre d'odométrie inertielle auto-supervisé qui élimine la dépendance aux données de vérité terrain en utilisant l'enregistrement ICP LiDAR comme signal d'apprentissage, tout en assurant robustesse et généralisation grâce à un équilibrage du mouvement et une pondération adaptative basée sur l'incertitude.

Jiwon Choi, Hogyun Kim, Geonmo Yang, Juhui Lee, Younggun Cho2026-03-09💻 cs

VG3S: Visual Geometry Grounded Gaussian Splatting for Semantic Occupancy Prediction

Le papier présente VG3S, un cadre novateur qui améliore la prédiction d'occupation sémantique 3D en intégrant des repères géométriques robustes issus de modèles de fondation visuels via un adaptateur hiérarchique, permettant d'obtenir des performances significativement supérieures sur le benchmark nuScenes.

Xiaoyang Yan, Muleilan Pei, Shaojie Shen2026-03-09💻 cs

Few-Shot Neural Differentiable Simulator: Real-to-Sim Rigid-Contact Modeling

Cet article propose un simulateur différentiable à base de réseaux de neurones graphiques et d'apprentissage par quelques exemples, qui combine la cohérence physique des modèles analytiques avec la capacité d'apprentissage des données réelles pour améliorer la fidélité des simulations de contacts rigides et l'efficacité de l'apprentissage de politiques robotiques.

Zhenhao Huang, Siyuan Luo, Bingyang Zhou, Ziqiu Zeng, Jason Pho, Fan Shi2026-03-09💻 cs

TaPD: Temporal-adaptive Progressive Distillation for Observation-Adaptive Trajectory Forecasting in Autonomous Driving

Le papier propose TaPD, un cadre unifié de distillation progressive adaptative au temps qui améliore la prédiction de trajectoire pour la conduite autonome en reconstruisant explicitement les historiques manquants et en transférant des connaissances de modèles à long terme, permettant ainsi des performances robustes même avec des observations très courtes.

Mingyu Fan, Yi Liu, Hao Zhou, Deheng Qian, Mohammad Haziq Khan, Matthias Raetsch2026-03-09🤖 cs.AI

NOVA: Next-step Open-Vocabulary Autoregression for 3D Multi-Object Tracking in Autonomous Driving

Le papier présente NOVA, une approche innovante de suivi multi-objets 3D qui utilise l'autorégression de modèles de langage pour généraliser la détection à des cibles inconnues en reformulant les trajectoires comme des séquences sémantiques spatio-temporelles, permettant ainsi d'atteindre des performances supérieures sur des catégories nouvelles grâce à un raisonnement sémantique de haut niveau.

Kai Luo, Xu Wang, Rui Fan, Kailun Yang2026-03-09💻 cs

← Précédent Suivant →