Generative Evolutionary Meta-Solver (GEMS): Scalable Surrogate-Free Multi-Agent Reinforcement Learning
Il paper presenta GEMS, un framework di apprendimento per rinforzo multi-agente scalabile e privo di surrogati che sostituisce le popolazioni esplicite di PSRO con un generatore ammortizzato e ancoraggi latenti, ottenendo prestazioni superiori in termini di velocità, efficienza memoria e ricompensa pur mantenendo le garanzie teoriche.