Integrating Lagrangian Neural Networks into the Dyna Framework for Reinforcement Learning

Dit paper introduceert een modelgebaseerde versterkingsleerframework dat Lagrangiaanse neurale netwerken integreert om de dynamica te leren volgens fysische wetten, waarbij wordt aangetoond dat een op toestandschatting gebaseerde optimisatie sneller convergeert dan een stochastische gradientmethode.

Shreya Das, Kundan Kumar, Muhammad Iqbal, Outi Savolainen, Dominik Baumann, Laura Ruotsalainen, Simo SärkkäTue, 10 Ma🤖 cs.LG

Input Dexterity and Output Negotiation in Feedback-Linearizable Nonlinear Systems

Dit artikel introduceert een taakgerelateerde taxonomie voor actuatoren in niet-lineaire systemen die feedback-lineariseerbaar zijn, waarbij 'dexterity'-inputs worden gedefinieerd als actuatoren die kunnen worden uitgeschakeld om de exacte linearisatie van een gereduceerde taak te behouden, wat leidt tot een verenigde regelaar die naadloos kan schakelen tussen volledige en gereduceerde taken zonder transiënten op gedeelde outputs.

Mirko Mizzoni, Pieter van Goor, Barbara Bazzana, Antonio FranchiTue, 10 Ma🔢 math

Synthesizing Interpretable Control Policies through Large Language Model Guided Search

Dit artikel presenteert een methode die Large Language Models en evolutionaire algoritmen combineert om interpreteerbare besturingspoliieken in standaard programmeertalen te synthetiseren voor dynamische systemen, zoals de pendel en de bal in de beker, waardoor transparantie en menselijke aanpasbaarheid worden vergroot ten opzichte van traditionele black-box benaderingen.

Carlo Bosio, Mark W. MuellerThu, 12 Ma⚡ eess

Robust targeted exploration for systems with non-stochastic disturbances

Deze paper presenteert een nieuwe, robuuste strategie voor gerichte exploratie van onzekere lineaire tijd-invariante systemen met energie-gebonden verstoringen, waarbij via een semidefiniet programma een exploratieplan wordt berekend dat een gewenste nauwkeurigheid van de parameterschatting garandeert zonder aannames over de verdeling van de verstoringen.

Janani Venkatasubramanian, Johannes Köhler, Mark Cannon, Frank AllgöwerThu, 12 Ma⚡ eess

Modular Control of Discrete Event System for Modeling and Mitigating Power System Cascading Failures

Dit artikel presenteert een modulaire supervisory control-methode voor discrete gebeurtenissystemen, geïmplementeerd in MATLAB, die de complexiteit verlaagt en de robuustheid verhoogt bij het voorspellen en mitigeren van kaskaderende storingen in elektriciteitsnetwerken, zoals aangetoond door simulaties op IEEE 30-, 118- en 300-bussystemen.

Wasseem Al-Rousan, Caisheng Wang, Feng LinThu, 12 Ma⚡ eess

Customized Interior-Point Methods Solver for Embedded Real-Time Convex Optimization

Dit artikel presenteert een op maat gemaakte tweede-orde kegelprogrammeringsoplosser voor ingebouwde real-time convex optimalisatie, die een efficiënte predictor-corrector methode combineert met een homogene embeddingsframework om kwadratische kostenfuncties direct te verwerken zonder herformulering, en wordt ondersteund door een codegeneratietool die volledig statisch toegewezen C-code genereert die superieur presteert aan bestaande oplossers in toepassingen voor geleiding en besturing.

Jae-Il Jang, Chang-Hun LeeThu, 12 Ma⚡ eess

Universal Dynamics with Globally Controlled Analog Quantum Simulators

Dit artikel bewijst dat analoge kwantumsimulatoren met globale besturing universeel zijn voor kwantumberekening, introduceert een direct optimalisatiekader voor de synthese van complexe interacties, en valideert experimenteel de realisatie van topologische dynamica en effectieve meerdeeltjesinteracties op Rydberg-atoomarrays.

Hong-Ye Hu, Abigail McClain Gomez, Liyuan Chen, Aaron Trowbridge, Andy J. Goldschmidt, Zachary Manchester, Frederic T. Chong, Arthur Jaffe, Susanne F. YelinThu, 12 Ma⚛️ quant-ph