Integrating Lagrangian Neural Networks into the Dyna Framework for Reinforcement Learning
Cet article propose un cadre d'apprentissage par renforcement basé sur un modèle de type Dyna intégrant des réseaux de neurones lagrangiens pour garantir le respect des lois physiques, démontrant ainsi une meilleure efficacité et une convergence plus rapide grâce à des optimiseurs basés sur l'estimation d'état.