MO-Playground: Massively Parallelized Multi-Objective Reinforcement Learning for Robotics
이 논문은 기존 MORL 알고리즘의 병렬화 한계를 극복하기 위해 GPU 네이티브 알고리즘인 MORLAX와 가속화된 환경 모음인 MO-Playground 를 제안함으로써, 복잡한 다목적 로봇 제어 문제를 기존 CPU 기반 접근법보다 25~270 배 빠르게 해결하고 우수한 파레토 프론트를 달성하는 방법을 제시합니다.