Learning Approximate Nash Equilibria in Cooperative Multi-Agent Reinforcement Learning via Mean-Field Subsampling
Cet article propose un cadre d'apprentissage alternatif, nommé ALTERNATING-MARL, pour les jeux coopératifs à grand nombre d'agents sous contraintes de communication, démontrant sa convergence vers une équation de Nash approchée avec une complexité d'échantillonnage réduite grâce à une subsampling de champ moyen.