Hybrid Belief Reinforcement Learning for Efficient Coordinated Spatial Exploration
Cet article présente un cadre d'apprentissage par renforcement hybride basé sur la croyance (HBRL) qui combine l'inférence spatiale par processus de Cox log-Gaussien et l'apprentissage par renforcement profond pour optimiser l'exploration coordonnée de plusieurs agents, démontrant une convergence plus rapide et des performances supérieures dans des tâches de fourniture de services sans fil.