Integrating Lagrangian Neural Networks into the Dyna Framework for Reinforcement Learning
Dit paper introduceert een modelgebaseerde versterkingsleerframework dat Lagrangiaanse neurale netwerken integreert om de dynamica te leren volgens fysische wetten, waarbij wordt aangetoond dat een op toestandschatting gebaseerde optimisatie sneller convergeert dan een stochastische gradientmethode.