Black Box Meta-Learning Intrinsic Rewards
Diese Arbeit stellt eine Methode vor, die Meta-Learning nutzt, um intrinsische Belohnungen als schwarze Kisten zu optimieren und so Reinforcement-Learning-Agenten in Umgebungen mit spärlichen Belohnungen zu besseren Daten-Effizienz und Generalisierungsfähigkeit zu verhelfen.