Boltzmann-based Exploration for Robust Decentralized Multi-Agent Planning (Extended Version)
Este trabajo presenta Coordinated Boltzmann MCTS (CB-MCTS), un nuevo enfoque de búsqueda en árboles de Monte Carlo descentralizado que utiliza una política estocástica basada en Boltzmann y una bonificación de entropía decreciente para superar las limitaciones de la exploración en entornos de recompensa dispersa o engañosa, demostrando un rendimiento superior frente a métodos existentes como Dec-MCTS.