Integrating Lagrangian Neural Networks into the Dyna Framework for Reinforcement Learning
Diese Arbeit integriert Lagrange-Neuronale Netze in das Dyna-Framework für modellbasiertes Reinforcement Learning, um physikalische Gesetze zu erzwingen und die Vorhersagegenauigkeit zu verbessern, wobei ein zustandsbasiertes Optimierungsverfahren eine schnellere Konvergenz als stochastische Gradientenverfahren aufweist.