MAVEN: A Meta-Reinforcement Learning Framework for Varying-Dynamics Expertise in Agile Quadrotor Maneuvers
Le cadre d'apprentissage par renforcement méta MAVEN permet à un quadrotor unique de naviguer de manière agile et robuste en temps réel face à des variations dynamiques extrêmes, telles que des changements de masse importants ou la perte d'un rotor, en inférant les dynamiques du système via un encodeur contextuel prédictif et en réalisant un transfert sim-to-real réussi.