Learning Approximate Nash Equilibria in Cooperative Multi-Agent Reinforcement Learning via Mean-Field Subsampling
Este artículo propone un marco de aprendizaje alterno para juegos cooperativos de múltiples agentes bajo restricciones de comunicación, demostrando que converge a un equilibrio de Nash aproximado con una complejidad muestral reducida al subsamplear el estado de los agentes mediante un enfoque de campo medio.