IPPO Learns the Game, Not the Team: A Study on Generalization in Heterogeneous Agent Teams
Este estudo demonstra que, no ambiente heterogêneo HeMAC, a estratégia padrão IPPO consegue generalizar eficazmente para novos parceiros de equipe sem necessidade de treinamento diversificado, performando de forma comparável a abordagens mais complexas como o Treinamento de Política Rotativa (RPT).