A Recipe for Stable Offline Multi-agent Reinforcement Learning
Cet article propose une méthode de normalisation des valeurs invariante à l'échelle (SVN) pour stabiliser l'apprentissage par renforcement multi-agents hors ligne et établit une recette pratique permettant de débloquer son plein potentiel.