Optimal strategies in Markov decision processes with finitely additive evaluations

Questo studio dimostra che, nei processi decisionali di Markov a orizzonte infinito valutati tramite una carica diffusa, non è garantita l'esistenza di una strategia ottimale (né pura né randomizzata) senza assumere il principio del valore temporale del denaro, fornendo un controesempio che risponde negativamente alla questione sollevata da Neyman.

János Flesch, Arkadi Predtetchinski, William D Sudderth + 1 more2026-03-05🔢 math