Residual Control for Fast Recovery from Dynamics Shifts

Ce papier propose une architecture de contrôle résiduel alignée sur la stabilité qui permet aux systèmes robotiques de récupérer rapidement des perturbations dynamiques imprévues en ajustant uniquement une couche additive bornée, sans retraining ni modification des paramètres de la politique nominale.

Nethmi Jayasinghe, Diana Gontero, Francesco Migliarba, Spencer T. Brown, Vinod K. Sangwan, Mark C. Hersam, Amit Ranjan Trivedi2026-03-10💻 cs

A Robust Antenna Provides Tactile Feedback in a Multi-legged Robot

Cet article présente un robot multi-pattes équipé d'antennes tactiles biomimétiques à compliance graduée qui, en convertissant la déformation mécanique en états de collision discrets, permettent une navigation autonome et fiable dans des environnements confinés sans recours à la vision ni à une information globale.

Zhaochen J. Xu, Juntao He, Delfin Aydan, Malaika Taylor, Tianyu Wang, Jianfeng Lin, Wesley Dyer, Daniel I. Goldman2026-03-10💻 cs

Inverse Resistive Force Theory (I-RFT): Learning granular properties through robot-terrain physical interactions

Cet article présente l'Inverse Resistive Force Theory (I-RFT), un cadre d'apprentissage automatique informé par la physique qui permet aux robots d'estimer les propriétés mécaniques des terrains granuleux à partir de forces de contact mesurées lors de mouvements naturels, tout en quantifiant l'incertitude pour optimiser l'exploration autonome.

Shipeng Liu, Feng Xue, Yifeng Zhang, Tarunika Ponnusamy, Feifei Qian2026-03-10💻 cs

Toward Global Intent Inference for Human Motion by Inverse Reinforcement Learning

Cette étude démontre qu'une fonction de coût unique et agnostique vis-à-vis du sujet et de la posture, dont les poids varient dans le temps et sont estimés via l'apprentissage par renforcement inverse, permet de prédire avec une grande précision les mouvements de reaching humains en privilégiant la régulation de l'accélération articulaire.

Sarmad Mehrdad, Maxime Sabbah, Vincent Bonnet, Ludovic Righetti2026-03-10🤖 cs.LG

Preference-Conditioned Reinforcement Learning for Space-Time Efficient Online 3D Bin Packing

Le papier présente STEP, une méthode d'apprentissage par renforcement conditionnée par des préférences qui permet aux robots d'optimiser le compromis entre la densité de remplissage et le temps d'exécution dans l'emballage 3D en ligne, réduisant ainsi le temps opérationnel de 44 % sans compromettre la densité de chargement.

Nikita Sarawgi, Omey M. Manyar, Fan Wang, Thinh H. Nguyen, Daniel Seita, Satyandra K. Gupta2026-03-10💻 cs

Uncertainty Mitigation and Intent Inference: A Dual-Mode Human-Machine Joint Planning System

Ce papier présente un système de planification conjointe humain-machine à double mode qui atténue l'incertitude et infère l'intention humaine via des conversations actives et une modélisation probabiliste, démontrant ainsi une réduction significative des coûts d'interaction et du temps d'exécution dans des environnements réels et simulés.

Zeyu Fang, Yuxin Lin, Cheng Liu, Beomyeol Yu, Zeyuan Yang, Rongqian Chen, Taeyoung Lee, Mahdi Imani, Tian Lan2026-03-10💻 cs

Reasoning Knowledge-Gap in Drone Planning via LLM-based Active Elicitation

Cet article présente un cadre novateur pour la planification collaborative drone-humain qui remplace le transfert de contrôle par une élicitation active d'informations via un mécanisme de raisonnement neuro-symbolique (MINT) et des modèles de langage, permettant ainsi de résoudre les ambiguïtés environnementales avec moins d'interactions humaines et un taux de réussite accru dans des tâches complexes.

Zeyu Fang, Beomyeol Yu, Cheng Liu, Zeyuan Yang, Rongqian Chen, Yuxin Lin, Mahdi Imani, Tian Lan2026-03-10💻 cs

Relating Reinforcement Learning to Dynamic Programming-Based Planning

Ce papier comble le fossé entre la planification par programmation dynamique et l'apprentissage par renforcement en développant une version déterministe de ce dernier, en établissant mathématiquement les conditions d'équivalence entre minimisation des coûts et maximisation des récompenses, et en préconisant l'optimisation d'un « vrai coût » plutôt que l'usage de paramètres arbitraires.

Filip V. Georgiev, Kalle G. Timperi, Basak Sakçak, Steven M. LaValle2026-03-10💻 cs

Viewpoint-Agnostic Grasp Pipeline using VLM and Partial Observations

Cet article présente un pipeline de préhension guidé par le langage et agnostique au point de vue, qui combine la détection d'objets ouverte, la compensation de profondeur et la complétion de nuages de points pour permettre à un robot quadrupède avec bras manipulateur d'exécuter des prises sûres et robustes dans des environnements encombrés et partiellement observés, atteignant un taux de succès de 90 % contre 30 % pour une méthode de référence dépendante de la vue.

Dilermando Almeida, Juliano Negri, Guilherme Lazzarini, Thiago H. Segreto, Ranulfo Bezerra, Ricardo V. Godoy, Marcelo Becker2026-03-10🤖 cs.LG

Choose What to Observe: Task-Aware Semantic-Geometric Representations for Visuomotor Policy

Ce papier propose une interface d'observation consciente de la tâche qui transforme les entrées visuelles brutes en représentations sémantico-géométriques normalisées, permettant aux politiques visuomotrices d'améliorer considérablement leur robustesse face aux changements d'apparence hors distribution sans nécessiter de réentraînement.

Haoran Ding, Liang Ma, Yaxun Yang, Wen Yang, Tianyu Liu, Anqing Duan, Xiaodan Liang, Dezhen Song, Ivan Laptev, Yoshihiko Nakamura2026-03-10💻 cs

RoboRouter: Training-Free Policy Routing for Robotic Manipulation

Le papier présente RoboRouter, un cadre d'acheminement de politiques sans entraînement qui améliore les taux de réussite des tâches de manipulation robotique en sélectionnant dynamiquement la meilleure politique parmi un ensemble hétérogène grâce à l'expérience d'exécution accumulée et à des représentations sémantiques des tâches.

Yiteng Chen, Zhe Cao, Hongjia Ren, Chenjie Yang, Wenbo Li, Shiyi Wang, Yemin Wang, Li Zhang, Yanming Shao, Zhenjun Zhao, Huiping Zhuang, Qingyao Wu2026-03-10💻 cs

NaviDriveVLM: Decoupling High-Level Reasoning and Motion Planning for Autonomous Driving

Le papier propose NaviDriveVLM, un cadre découplé pour la conduite autonome qui sépare le raisonnement de haut niveau d'un grand modèle navigateur de la génération d'actions via un pilote léger, permettant ainsi de surmonter les compromis entre compréhension sémantique et contrôle précis tout en surpassant les modèles VLM existants sur le benchmark nuScenes.

Ximeng Tao, Pardis Taghavi, Dimitar Filev, Reza Langari, Gaurav Pandey2026-03-10🤖 cs.LG

DyQ-VLA: Temporal-Dynamic-Aware Quantization for Embodied Vision-Language-Action Models

Le papier présente DyQ-VLA, un cadre de quantification dynamique pour les modèles Vision-Language-Action qui, en adaptant la précision des bits en temps réel grâce à des proxies cinématiques, réduit considérablement l'empreinte mémoire et accélère l'inférence tout en préservant les performances.

Zihao Zheng, Hangyu Cao, Sicheng Tian, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Zhaobo Zhang, Xuanzhe Liu, Donggang Cao, Hong Mei, Xiang Chen2026-03-10🤖 cs.LG

Long-Short Term Agents for Pure-Vision Bronchoscopy Robotic Autonomy

Cette étude présente un cadre d'autonomie purement visuelle pour la navigation bronchoscopique robotisée, utilisant une hiérarchie d'agents à court et long terme ainsi qu'un critique basé sur un modèle du monde pour atteindre des cibles préopératoires sans suivi externe, démontrant ainsi une faisabilité préclinique comparable à celle d'un expert humain.

Junyang Wu, Mingyi Luo, Fangfang Xie, Minghui Zhang, Hanxiao Zhang, Chunxi Zhang, Junhao Wang, Jiayuan Sun, Yun Gu, Guang-Zhong Yang2026-03-10💻 cs

Omnidirectional Humanoid Locomotion on Stairs via Unsafe Stepping Penalty and Sparse LiDAR Elevation Mapping

Cet article présente un cadre d'apprentissage unique intégrant une pénalité de pose de pied dangereuse dense et une cartographie d'élévation LiDAR affinée par un réseau de neurones, permettant aux robots humanoïdes de réaliser une locomotion omnidirectionnelle sûre et stable sur des escaliers et des terrains complexes.

Yuzhi Jiang, Yujun Liang, Junhao Li, Han Ding, Lijun Zhu2026-03-10💻 cs

Unified Structural-Hydrodynamic Modeling of Underwater Underactuated Mechanisms and Soft Robots

Ce papier propose un cadre d'optimisation global piloté par les trajectoires, inspiré de la stratégie d'évolution CMA-ES, pour modéliser de manière unifiée les paramètres structurels et hydrodynamiques couplés des mécanismes sous-actués et des robots mous sous-marins, permettant ainsi une reproduction fidèle de leur comportement et une transférabilité efficace entre différents systèmes sans recalibrage manuel.

Chenrui Zhang, Yiyuan Zhang, Yunfei Ye, Junkai Chen, Haozhe Wang, Cecilia Laschi2026-03-10🔬 physics

RAPID: Redundancy-Aware and Compatibility-Optimal Edge-Cloud Partitioned Inference for Diverse VLA models

Le papier propose RAPID, un cadre d'inférence collaboratif edge-cloud innovant conçu pour optimiser le partitionnement des modèles VLA en atténuant les interférences du bruit visuel et en préservant la continuité physique des mouvements grâce à la prise en compte de la redondance, permettant ainsi d'obtenir une accélération allant jusqu'à 1,73 fois avec une surcharge minimale.

Zihao Zheng, Sicheng Tian, Hangyu Cao, Chenyue Li, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Guojie Luo, Xiang Chen2026-03-10💻 cs