Cost-Driven Representation Learning for Linear Quadratic Gaussian Control: Part I
Este artigo estabelece garantias de amostragem finita para um método de aprendizado de representação de estado orientado a custos que, ao prever custos multietapa sem modelar observações ou ações, permite encontrar controladores e representações latentes quase ótimos para problemas de controle Linear Quadrático Gaussiano (LQG) de horizonte finito.