cs.RO articles | Gist.Science

Diffusion Policy through Conditional Proximal Policy Optimization

Cet article propose une méthode novatrice et efficace, nommée Diffusion Policy through Conditional Proximal Policy Optimization, qui permet d'entraîner des politiques de diffusion en apprentissage par renforcement on-policy en alignant l'itération de la politique sur le processus de diffusion, surmontant ainsi les défis de calcul de vraisemblance et permettant une génération d'actions multimodales performante.

Ben Liu, Shunpeng Yang, Hua Chen2026-03-06💻 cs

On the Strengths and Weaknesses of Data for Open-set Embodied Assistance

Cet article examine les forces et faiblesses des données pour l'assistance ouverte en corps, démontrant que des modèles multimodaux fine-tunés sur des données synthétiques variées (incluant l'ancrage multimodal et l'inférence de défauts) peuvent généraliser efficacement à de nouveaux comportements utilisateurs et configurations dans des tâches d'assistance corrective.

Pradyumna Tambwekar, Andrew Silva, Deepak Gopinath + 3 more2026-03-06🤖 cs.AI

Task-Relevant and Irrelevant Region-Aware Augmentation for Generalizable Vision-Based Imitation Learning in Agricultural Manipulation

Ce papier présente DRAIL, un cadre d'augmentation d'apprentissage par imitation qui améliore la généralisation des robots agricoles en séparant et en traitant différemment les régions visuelles pertinentes pour la tâche et le fond pour surmonter les variations d'apparence des cultures et les changements de contexte.

Shun Hattori, Hikaru Sasaki, Takumi Hachimine + 2 more2026-03-06💻 cs

Hyperbolic Multiview Pretraining for Robotic Manipulation

Ce papier présente HyperMVP, un cadre d'apprentissage prédictif auto-supervisé en espace hyperbolique qui, couplé au nouveau jeu de données 3D-MOV, améliore la robustesse et la généralisation des politiques de manipulation robotique en capturant efficacement les relations structurelles spatiales.

Jin Yang, Ping Wei, Yixin Chen2026-03-06💻 cs

Causally Robust Reward Learning from Reason-Augmented Preference Feedback

Le papier présente ReCouPLe, un cadre léger qui utilise des rationales textuelles pour apprendre des récompenses causalement robustes à partir de préférences, permettant ainsi une généralisation supérieure aux tâches nouvelles et une meilleure résistance aux confusions causales par rapport aux méthodes existantes.

Minjune Hwang, Yigit Korkmaz, Daniel Seita + 1 more2026-03-06🤖 cs.AI

VPWEM: Non-Markovian Visuomotor Policy with Working and Episodic Memory

Ce papier présente VPWEM, une politique visuomotrice non markovienne qui intègre une mémoire de travail et une mémoire épisodique compressée via un mécanisme Transformer pour surmonter les limites des approches actuelles dans les tâches robotiques nécessitant une mémoire à long terme, surpassant ainsi les modèles de l'état de l'art sur plusieurs benchmarks.

Yuheng Lei, Zhixuan Liang, Hongyuan Zhang + 1 more2026-03-06🤖 cs.AI

Beyond the Patch: Exploring Vulnerabilities of Visuomotor Policies via Viewpoint-Consistent 3D Adversarial Object

Cet article propose une méthode d'optimisation de textures adverses 3D cohérentes avec le point de vue, utilisant un rendu différentiable et une stratégie de curriculum de grossier à fin, pour révéler et exploiter les vulnérabilités des politiques visuomotrices robotiques face à des changements de perspectives dynamiques.

Chanmi Lee, Minsung Yoon, Woojae Kim + 2 more2026-03-06💻 cs

U-OBCA: Uncertainty-Aware Optimization-Based Collision Avoidance via Wasserstein Distributionally Robust Chance Constraints

Cet article présente U-OBCA, une méthode de planification de trajectoire qui améliore l'efficacité de la navigation des robots dans des environnements encombrés en éliminant les approximations géométriques conservatrices et en traitant les incertitudes via des contraintes de risque probabilistes basées sur la robustesse distributionnelle de Wasserstein.

Zehao Wang, Yuxuan Tang, Han Zhang + 2 more2026-03-06🔢 math

Integrated cooperative localization of heterogeneous measurement swarm: A unified data-driven method

Cet article propose une méthode unifiée et pilotée par les données pour la localisation coopérative de systèmes robotiques hétérogènes, permettant d'estimer les positions relatives et globales même avec des topologies de mesure directionnelles et faiblement connectées, surpassant ainsi les limitations géométriques des approches existantes.

Kunrui Ze, Wei Wang, Guibin Sun + 3 more2026-03-06💻 cs

Person Detection and Tracking from an Overhead Crane LiDAR

Cet article présente la création d'un jeu de données spécifique pour la détection et le suivi de personnes à l'aide d'un LiDAR monté sur une grue aérienne, en adaptant des détecteurs 3D existants pour combler le fossé entre les benchmarks de conduite et la vision industrielle en vue plongeante, tout en validant la faisabilité temps réel et en rendant les ressources disponibles publiquement.

Nilusha Jayawickrama, Henrik Toikka, Risto Ojala2026-03-06🤖 cs.LG

Observer Design for Augmented Reality-based Teleoperation of Soft Robots

Cet article présente un système de téléopération de robots souples utilisant la réalité augmentée (HoloLens 2) et un observateur basé sur la physique, validé sur le manipulateur pneumatique PETER avec une erreur d'estimation de position d'environ 5 %.

Jorge Francisco García-Samartín, Iago López Pérez, Emirhan Yolcu + 2 more2026-03-06💻 cs

Direct Contact-Tolerant Motion Planning With Vision Language Models

Cet article présente un planificateur de mouvement direct tolérant au contact (DCT) qui intègre des modèles vision-langage pour générer des nuages de points conscients du contact et optimiser la navigation, permettant ainsi à des robots de se déplacer de manière robuste et efficace dans des environnements encombrés avec des obstacles mobiles.

He Li, Jian Sun, Chengyang Li + 4 more2026-03-06💻 cs

CoIn3D: Revisiting Configuration-Invariant Multi-Camera 3D Object Detection

Le papier présente CoIn3D, un cadre généralisable pour la détection d'objets 3D multi-caméras qui améliore le transfert vers des configurations inédites en intégrant explicitement les disparités des priors spatiaux (intrinsèques, extrinsèques et agencement) via une modulation de caractéristiques spatiales et une augmentation de données par synthèse d'images.

Zhaonian Kuang, Rui Ding, Haotian Wang + 3 more2026-03-06💻 cs

VinePT-Map: Pole-Trunk Semantic Mapping for Resilient Autonomous Robotics in Vineyards

Ce papier présente VinePT-Map, un cadre de cartographie sémantique résilient qui exploite les troncs de vigne et les poteaux comme repères structurels persistants pour permettre une localisation robuste et saisonnièrement agnostique des robots autonomes dans les vignobles.

Giorgio Audrito, Mauro Martini, Alessandro Navone + 2 more2026-03-06💻 cs

AIM-SLAM: Dense Monocular SLAM via Adaptive and Informative Multi-View Keyframe Prioritization with Foundation Model

Ce papier présente AIM-SLAM, un système de SLAM monoculaire dense qui améliore la reconstruction et l'estimation de pose en intégrant un modèle fondation géométrique (VGGT) avec une priorisation adaptative et informative des images clés via le module SIGMA pour une optimisation multi-vues cohérente.

Jinwoo Jeon, Dong-Uk Seo, Eungchang Mason Lee + 1 more2026-03-06💻 cs

GaussTwin: Unified Simulation and Correction with Gaussian Splatting for Robotic Digital Twins

Le papier présente GaussTwin, un jumeau numérique temps réel qui unifie la simulation physique et la correction visuelle via le splatting gaussien pour améliorer la précision du suivi et la robustesse des interactions robotiques en boucle fermée.

Yichen Cai, Paul Jansonnie, Cristiana de Farias + 2 more2026-03-06💻 cs

SPIRIT: Perceptive Shared Autonomy for Robust Robotic Manipulation under Deep Learning Uncertainty

Le système SPIRIT propose une autonomie partagée perceptive qui régule dynamiquement le niveau d'autonomie d'un robot en fonction des estimations d'incertitude de la perception par apprentissage profond, basculant vers la téléopération haptique en cas de doute pour garantir une manipulation robuste et sûre.

Jongseok Lee, Ribin Balachandran, Harsimran Singh + 6 more2026-03-06🤖 cs.AI

Decoupling Task and Behavior: A Two-Stage Reward Curriculum in Reinforcement Learning for Robotics

Cet article propose une méthode d'apprentissage par renforcement en deux étapes qui découple les objectifs de tâche des termes comportementaux via un curriculum de récompense, permettant d'améliorer la stabilité et la robustesse de l'entraînement des robots sur des tâches multi-objectifs.

Kilian Freitag, Knut Åkesson, Morteza Haghir Chehreghani2026-03-06🤖 cs.LG

SeedPolicy: Horizon Scaling via Self-Evolving Diffusion Policy for Robot Manipulation

Le papier présente SeedPolicy, une méthode d'apprentissage par imitation qui intègre un module d'attention gating auto-évolutif (SEGA) aux politiques de diffusion pour surmonter les limitations de modélisation temporelle et permettre une manipulation robotique efficace sur de longues horizons avec une faible complexité paramétrique.

Youqiang Gui, Yuxuan Zhou, Shen Cheng + 4 more2026-03-06💻 cs

Act, Think or Abstain: Complexity-Aware Adaptive Inference for Vision-Language-Action Models

Ce papier propose un cadre d'inférence adaptatif pour les modèles Vision-Language-Action qui, en analysant la complexité de l'état perçu via des embeddings visuels, permet de décider dynamiquement d'agir immédiatement, de raisonner sur des scénarios ambigus ou de s'abstenir d'agir pour éviter les échecs catastrophiques, optimisant ainsi l'allocation des ressources computationnelles.

Riccardo Andrea Izzo, Gianluca Bardaro, Matteo Matteucci2026-03-06💻 cs

← Précédent Suivant →