Enhancing Heterogeneous Multi-Agent Cooperation in Decentralized MARL via GNN-driven Intrinsic Rewards
Deze paper introduceert CoHet, een algoritme dat graph neural networks gebruikt om intrinsieke beloningen te genereren en zo de samenwerking tussen heterogene agents in gedecentraliseerde multi-agent versterkingsleer te verbeteren, zelfs bij gedeeltelijke waarneembaarheid en schaarse beloningen.