PAC Guarantees for Reinforcement Learning: Sample Complexity, Coverage, and Structure
Questo articolo esamina i progressi compiuti tra il 2018 e il 2025 nelle garanzie PAC per l'apprendimento per rinforzo, proponendo il nuovo framework CSO (Copertura-Struttura-Obiettivo) come strumento interpretativo per analizzare la complessità dei campioni, classificare i risultati teorici e fornire strumenti pratici per gli utenti.