Integrating Lagrangian Neural Networks into the Dyna Framework for Reinforcement Learning

Diese Arbeit integriert Lagrange-Neuronale Netze in das Dyna-Framework für modellbasiertes Reinforcement Learning, um physikalische Gesetze zu erzwingen und die Vorhersagegenauigkeit zu verbessern, wobei ein zustandsbasiertes Optimierungsverfahren eine schnellere Konvergenz als stochastische Gradientenverfahren aufweist.

Shreya Das, Kundan Kumar, Muhammad Iqbal, Outi Savolainen, Dominik Baumann, Laura Ruotsalainen, Simo SärkkäTue, 10 Ma🤖 cs.LG

Input Dexterity and Output Negotiation in Feedback-Linearizable Nonlinear Systems

Die Arbeit führt eine aufgabenbezogene Taxonomie von Aktoreingängen für nichtlineare Systeme ein, die es ermöglicht, durch die Identifizierung von „Dexteritäts"-Eingängen einen einheitlichen linearisierenden Regler zu entwerfen, der einen nahtlosen Übergang zwischen vollständigen und reduzierten Aufgaben ohne Transienten auf gemeinsamen Ausgängen erlaubt.

Mirko Mizzoni, Pieter van Goor, Barbara Bazzana, Antonio FranchiTue, 10 Ma🔢 math

Universal Dynamics with Globally Controlled Analog Quantum Simulators

Diese Arbeit beweist, dass analoge Quantensimulatoren mit globaler Kontrolle universell sind, entwickelt einen direkten optimalen Kontrollrahmen zur Überwindung experimenteller Einschränkungen und demonstriert experimentell die Realisierung komplexer Vielteilchenwechselwirkungen und topologischer Dynamik auf Rydberg-Atom-Arrays.

Hong-Ye Hu, Abigail McClain Gomez, Liyuan Chen, Aaron Trowbridge, Andy J. Goldschmidt, Zachary Manchester, Frederic T. Chong, Arthur Jaffe, Susanne F. YelinThu, 12 Ma⚛️ quant-ph

Safe and Optimal Learning from Preferences via Weighted Temporal Logic with Applications in Robotics and Formula 1

Die vorgestellte Arbeit entwickelt einen effizienten und sicherheitsgarantierten Ansatz, der mittels struktureller Optimierung und Umformulierung als gemischt-ganzzahliges lineares Programm (MILP) aus menschlichen Präferenzen, Rangfolgen oder Demonstrationen optimale Verhaltensstrategien für autonome Systeme in sicherheitskritischen Anwendungen wie Robotik und Formel 1 ableitet.

Ruya Karagulle, Cristian-Ioan Vasile, Necmiye OzayThu, 12 Ma⚡ eess