Optimal strategies in Markov decision processes with finitely additive evaluations

Cet article démontre que, contrairement au cas où la charge diffuse satisfait le principe de la valeur temporelle de l'argent, il existe des processus de décision markoviens à horizon infini et espaces finis qui ne possèdent aucune stratégie optimale, ni pure ni randomisée, lorsque la charge d'agrégation est choisie de manière adéquate.

János Flesch, Arkadi Predtetchinski, William D Sudderth + 1 more2026-03-05🔢 math