Learning Approximate Nash Equilibria in Cooperative Multi-Agent Reinforcement Learning via Mean-Field Subsampling
Die Autoren stellen einen alternierenden Lernrahmen vor, der in kooperativen Multi-Agenten-Systemen mit eingeschränkter Beobachtung durch Subsampling eines Teils der Agentenzustände eine approximative Nash-Gleichgewichtslösung mit verbesserter Probenkomplexität erreicht.