Robustness to Model Approximation, Model Learning From Data, and Sample Complexity in Wasserstein Regular MDPs
Il paper analizza la robustezza e la complessità campionaria del controllo ottimo stocastico discreto sotto approssimazione di modello basata sulla distanza di Wasserstein, dimostrando come la perdita di prestazioni sia limitata dalla distanza Wasserstein-1 tra i kernel di transizione e fornendo applicazioni pratiche per l'apprendimento empirico di modelli e distribuzioni di rumore.