RL-Augmented MPC for Non-Gaited Legged and Hybrid Locomotion
Die Autoren stellen eine hierarchische Architektur vor, die Reinforcement Learning mit Modellprädiktiver Regelung koppelt, um durch das Lernen von Gangmustern in der Simulation den rechenintensiven Abtastzeitpunkt für Kontakten zu entlasten und dabei eine erfolgreiche Null-Shot-Übertragung von der Simulation auf reale, nicht-gangbasierte und hybride Laufroboter ohne Domänenrandomisierung zu ermöglichen.