Learning Approximate Nash Equilibria in Cooperative Multi-Agent Reinforcement Learning via Mean-Field Subsampling
Il paper propone un framework di apprendimento alternato per giochi Markoviani cooperativi con vincoli di comunicazione, dimostrando che l'agente globale e gli agenti locali convergono verso un equilibrio di Nash approssimato con complessità campionaria ridotta rispetto allo spazio congiunto di stati e azioni.