Learning Approximate Nash Equilibria in Cooperative Multi-Agent Reinforcement Learning via Mean-Field Subsampling
Este artigo propõe e analisa o framework de aprendizado alternado , que permite a um agente global e a uma população massiva de agentes locais em sistemas com restrições de comunicação convergirem para um Equilíbrio de Nash aproximado com complexidade de amostra reduzida, validando a eficácia da abordagem em simulações de controle multi-robô e otimização federada.