Enhancing Heterogeneous Multi-Agent Cooperation in Decentralized MARL via GNN-driven Intrinsic Rewards
El artículo presenta CoHet, un algoritmo que utiliza motivación intrínseca basada en Redes Neuronales de Grafos para mejorar la cooperación descentralizada entre agentes heterogéneos en entornos de aprendizaje por refuerzo multiagente con observabilidad parcial y recompensas escasas.