Boltzmann-based Exploration for Robust Decentralized Multi-Agent Planning (Extended Version)
Il paper presenta il Coordinated Boltzmann MCTS (CB-MCTS), un nuovo approccio decentralizzato che sostituisce la politica UCT deterministica con una strategia stocastica basata su Boltzmann e un bonus di entropia decrescente, risultando superiore al Dec-MCTS tradizionale in scenari ingannevoli e a ricompensa scarsa.