Cost-Driven Representation Learning for Linear Quadratic Gaussian Control: Part I
Este trabajo establece garantías finitas de muestra para un método de aprendizaje de representaciones de estado impulsado por costos que predice costos multietapa sin observar acciones ni observaciones, logrando así un controlador y una representación casi óptimos para problemas de control lineal cuadrático gaussiano (LQG) de horizonte finito.