Quadrotor Navigation using Reinforcement Learning with Privileged Information
Diese Arbeit stellt eine Reinforcement-Learning-Methode für die Navigation von Quadrotoren vor, die mittels privilegierter Zeit-Ankunfts-Karten und einer neuen Verlustfunktion Hindernisse erfolgreich umfliegt und sich sowohl in Simulationen als auch in 20 erfolgreichen Außenflügen bei Geschwindigkeiten bis zu 4 m/s bewährt hat.