Open-World Reinforcement Learning over Long Short-Term Imagination
Das Paper stellt LS-Imagine vor, eine Methode, die durch die Einführung eines lang-kurzfristigen Weltmodells und die Simulation zielgerichteter Sprungübergänge die Erkundungseffizienz in hochdimensionalen offenen Welten verbessert und so langfristige Belohnungen effektiver nutzt.