RL-Augmented MPC for Non-Gaited Legged and Hybrid Locomotion
Les auteurs proposent une architecture hiérarchique couplant apprentissage par renforcement et contrôle prédictif de modèle pour générer des gaites acycliques et des commandes de navigation, validée avec succès sur plusieurs plateformes robotiques allant de 50 à 120 kg, y compris un transfert zéro-shot vers le robot Centauro sans randomisation de domaine.