Next Embedding Prediction Makes World Models Stronger
Le papier présente NE-Dreamer, un agent d'apprentissage par renforcement sans décodeur qui utilise un transformateur temporel pour prédire les prochaines embeddings et ainsi apprendre des représentations d'état cohérentes, surpassant ou égalant les performances des méthodes de pointe sur des tâches complexes partiellement observables.