ProgAgent:A Continual RL Agent with Progress-Aware Rewards
Der Artikel stellt ProgAgent vor, einen kontinuierlichen Reinforcement-Learning-Agenten, der durch die Kombination von fortschrittsbasierten Belohnungen aus ungelabelten Expertenvideos, einer adversativen Regularisierung zur Vermeidung von Überanpassung und einer hocheffizienten JAX-Architektur das Vergessen verhindert und das robotische Lernen aus wenigen Demonstrationen erheblich verbessert.