CDE: Concept-Driven Exploration for Reinforcement Learning
Ce papier propose CDE, une méthode d'exploration en apprentissage par renforcement qui utilise un modèle vision-langage pré-entraîné pour générer des concepts visuels et les exploiter via une tâche de reconstruction comme récompense intrinsèque, permettant ainsi une exploration ciblée efficace dans des tâches de manipulation visuelle complexes, y compris dans le monde réel.