Cost-Driven Representation Learning for Linear Quadratic Gaussian Control: Part II
Este trabajo presenta garantías finitas de muestra para aprender representaciones de estado impulsadas por costos y controladores subóptimos en sistemas de control lineal cuadrático gaussiano (LQG) de horizonte infinito, abordando tanto modelos de dinámica latente explícitos como implícitos (similares a MuZero) y estableciendo una nueva contribución técnica sobre la excitación persistente en procesos estocásticos.