Cost-Driven Representation Learning for Linear Quadratic Gaussian Control: Part I
Cet article établit des garanties théoriques en échantillonnage fini pour une méthode d'apprentissage de représentations d'états pilotée par le coût, permettant de résoudre des problèmes de contrôle linéaire quadratique gaussien (LQG) à horizon fini sans prédire les observations ou les actions.