MO-Playground: Massively Parallelized Multi-Objective Reinforcement Learning for Robotics
Il paper presenta MORLAX e MO-Playground, un nuovo algoritmo MORL nativo per GPU e un ambiente di gioco accelerato che sfruttano il parallelismo massivo per ridurre drasticamente i tempi di calcolo e migliorare le prestazioni nella risoluzione di complessi problemi robotici multi-obiettivo.