Integrating Lagrangian Neural Networks into the Dyna Framework for Reinforcement Learning

Cet article propose un cadre d'apprentissage par renforcement basé sur un modèle de type Dyna intégrant des réseaux de neurones lagrangiens pour garantir le respect des lois physiques, démontrant ainsi une meilleure efficacité et une convergence plus rapide grâce à des optimiseurs basés sur l'estimation d'état.

Shreya Das, Kundan Kumar, Muhammad Iqbal, Outi Savolainen, Dominik Baumann, Laura Ruotsalainen, Simo SärkkäTue, 10 Ma🤖 cs.LG

Behavioral Generative Agents for Power Dispatch and Auction

Cet article démontre que des agents génératifs alimentés par des modèles de langage peuvent atténuer la rigidité des modèles mathématiques traditionnels pour la prise de décision humaine dans la gestion de l'énergie et les enchères, en reproduisant à la fois des stratégies rationnelles et des déviations comportementales systématiques grâce à l'apprentissage en contexte.

Shaoze Li, Justin S. Kim, Cong ChenTue, 10 Ma💻 cs

Input Dexterity and Output Negotiation in Feedback-Linearizable Nonlinear Systems

Cet article propose une taxonomie des entrées d'actionneurs dans les systèmes non linéaires linéarisables par retour d'état, distinguant les entrées essentielles, redondantes et de dextérité, afin de concevoir un contrôleur unifié capable de négocier dynamiquement entre des tâches complètes et réduites sans transitoires sur les sorties partagées.

Mirko Mizzoni, Pieter van Goor, Barbara Bazzana, Antonio FranchiTue, 10 Ma🔢 math

Max-Consensus with Deterministic Convergence in Directed Graphs with Unreliable Communication Links

Cet article présente DMaC, un algorithme distribué novateur qui garantit une convergence déterministe et en temps fini vers le consensus de maximum dans des graphes dirigés avec des liens de communication non fiables, en utilisant des canaux de rétroaction étroits pour assurer l'exactitude du calcul et permettre un mécanisme d'arrêt autonome.

Apostolos I. Rikos, Jiaqi Hu, Themistoklis Charalambous, Karl Henrik JohannsonThu, 12 Ma⚡ eess

Synthesizing Interpretable Control Policies through Large Language Model Guided Search

Cet article propose une méthode novatrice utilisant des modèles de langage pour générer et faire évoluer des politiques de contrôle interprétables sous forme de programmes Python, offrant une alternative transparente et modifiable aux approches par réseaux de neurones pour des tâches dynamiques complexes comme le balancement d'un pendule ou la gestion d'une balle dans une coupe.

Carlo Bosio, Mark W. MuellerThu, 12 Ma⚡ eess

Modular Control of Discrete Event System for Modeling and Mitigating Power System Cascading Failures

Cet article propose une approche de contrôle supervisaire modulaire des systèmes à événements discrets, implémentée sur MATLAB et validée sur les réseaux IEEE 30, 118 et 300, afin de réduire la complexité computationnelle et d'améliorer la prédiction et l'atténuation des défaillances en cascade dans les systèmes électriques.

Wasseem Al-Rousan, Caisheng Wang, Feng LinThu, 12 Ma⚡ eess

Score Matching Diffusion Based Feedback Control and Planning of Nonlinear Systems

Cet article propose un cadre déterministe de contrôle basé sur l'appariement de scores et les processus de diffusion pour piloter la densité de probabilité de systèmes non linéaires vers une distribution cible, en transformant la synthèse de commande en la construction d'un processus inverse qui agit comme une loi de rétroaction de débruitage.

Karthik Elamvazhuthi, Darshan Gadginmath, Fabio PasqualettiThu, 12 Ma⚡ eess

Customized Interior-Point Methods Solver for Embedded Real-Time Convex Optimization

Cet article présente un solveur de programmation conique de second ordre (SOCP) personnalisé pour l'optimisation convexe temps réel embarquée, basé sur une méthode de points intérieurs primal-duale avec homogénéisation, capable de traiter directement des fonctions de coût quadratiques sans reformulation et généré automatiquement en code C sans dépendances externes pour surpasser les solveurs existants dans les applications de guidage et de contrôle.

Jae-Il Jang, Chang-Hun LeeThu, 12 Ma⚡ eess

Universal Dynamics with Globally Controlled Analog Quantum Simulators

Cet article établit les conditions nécessaires et suffisantes pour l'universalité des simulateurs quantiques analogiques à contrôle global, propose une méthode de contrôle optimal direct pour synthétiser des Hamiltoniens complexes sous contraintes matérielles, et démontre expérimentalement la réalisation d'interactions à trois corps et de dynamiques topologiques sur une plateforme d'atomes de Rydberg.

Hong-Ye Hu, Abigail McClain Gomez, Liyuan Chen, Aaron Trowbridge, Andy J. Goldschmidt, Zachary Manchester, Frederic T. Chong, Arthur Jaffe, Susanne F. YelinThu, 12 Ma⚛️ quant-ph

System-Theoretic Analysis of Dynamic Generalized Nash Equilibria -- Turnpikes and Dissipativity

Cet article établit un lien fondamental entre la dissipativité stricte et le phénomène de turnpike dans les équilibres de Nash généralisés dynamiques, en fournissant des conditions pour l'optimalité de l'état stationnaire et en concevant des pénalités terminales assurant la stabilité des trajectoires dans le cadre du contrôle prédictif basé sur la théorie des jeux.

Sophie Hall, Florian Dörfler, Timm FaulwasserThu, 12 Ma⚡ eess

Safe and Optimal Learning from Preferences via Weighted Temporal Logic with Applications in Robotics and Formula 1

Cet article propose une méthode sûre et optimale pour apprendre à partir de préférences humaines en utilisant la logique temporelle pondérée (WSTL), transformant le problème d'apprentissage en un programme linéaire en nombres mixtes grâce à des techniques d'élagage et de transformation logarithmique, et validant son efficacité sur des applications robotiques et en Formule 1.

Ruya Karagulle, Cristian-Ioan Vasile, Necmiye OzayThu, 12 Ma⚡ eess