Boltzmann-based Exploration for Robust Decentralized Multi-Agent Planning (Extended Version)
Dit paper introduceert Coordinated Boltzmann MCTS (CB-MCTS), een nieuwe methode die deterministische UCT vervangt door een stochastisch Boltzmann-beleid met een vervagende entropiebonus om Dec-MCTS robuuster te maken in omgevingen met schaarse of scheef verdeelde beloningen.