Learning Approximate Nash Equilibria in Cooperative Multi-Agent Reinforcement Learning via Mean-Field Subsampling
Deze paper introduceert een wisselend leerframework voor cooperatieve multi-agent versterking die, onder beperkte observatie van een subset van lokale agenten, convergeert naar een benaderend Nash-evenwicht met een sample complexiteit die onafhankelijk is van de gezamenlijke actie- en toestandsruimte.