cs.SY articles | Gist.Science

Integrating Lagrangian Neural Networks into the Dyna Framework for Reinforcement Learning

Cet article propose un cadre d'apprentissage par renforcement basé sur un modèle de type Dyna intégrant des réseaux de neurones lagrangiens pour garantir le respect des lois physiques, démontrant ainsi une meilleure efficacité et une convergence plus rapide grâce à des optimiseurs basés sur l'estimation d'état.

Shreya Das, Kundan Kumar, Muhammad Iqbal, Outi Savolainen, Dominik Baumann, Laura Ruotsalainen, Simo SärkkäTue, 10 Ma🤖 cs.LG

Behavioral Generative Agents for Power Dispatch and Auction

Cet article démontre que des agents génératifs alimentés par des modèles de langage peuvent atténuer la rigidité des modèles mathématiques traditionnels pour la prise de décision humaine dans la gestion de l'énergie et les enchères, en reproduisant à la fois des stratégies rationnelles et des déviations comportementales systématiques grâce à l'apprentissage en contexte.

Shaoze Li, Justin S. Kim, Cong ChenTue, 10 Ma💻 cs

Input Dexterity and Output Negotiation in Feedback-Linearizable Nonlinear Systems

Cet article propose une taxonomie des entrées d'actionneurs dans les systèmes non linéaires linéarisables par retour d'état, distinguant les entrées essentielles, redondantes et de dextérité, afin de concevoir un contrôleur unifié capable de négocier dynamiquement entre des tâches complètes et réduites sans transitoires sur les sorties partagées.

Mirko Mizzoni, Pieter van Goor, Barbara Bazzana, Antonio FranchiTue, 10 Ma🔢 math

Rethinking Strict Dissipativity for Economic MPC

Cet article propose le concept novateur de dissipation stricte à deux fonctions de stockage pour établir des conditions nécessaires et suffisantes de stabilité asymptotique en commande prédictive économique, en reliant directement ces conditions aux fonctions de valeur et en offrant des alternatives plus vérifiables à la dissipation stricte classique.

Mario ZanonTue, 10 Ma🔢 math

Response time central-limit and failure rate estimation for stationary periodic rate monotonic real-time systems

Cet article propose une méthode d'estimation des taux de défaillance dans les systèmes temps réel à priorité monotone de taux, en modélisant les temps de réponse par un mélange de distributions gaussiennes inverses et en utilisant un algorithme de maximisation de l'espérance adapté pour valider cette approche par simulation.

Kevin Zagalo, Avner Bar-HenThu, 12 Ma⚡ eess

Automated Layout and Control Co-Design of Robust Multi-UAV Transportation Systems

Cet article présente une méthode novatrice de co-conception qui optimise conjointement la disposition physique et le contrôle d'un système de transport aérien multi-UAV robuste, afin d'améliorer la précision et la capacité de rejet des perturbations lors du transport de charges.

Carlo Bosio, Mark W. MuellerThu, 12 Ma⚡ eess

Max-Consensus with Deterministic Convergence in Directed Graphs with Unreliable Communication Links

Cet article présente DMaC, un algorithme distribué novateur qui garantit une convergence déterministe et en temps fini vers le consensus de maximum dans des graphes dirigés avec des liens de communication non fiables, en utilisant des canaux de rétroaction étroits pour assurer l'exactitude du calcul et permettre un mécanisme d'arrêt autonome.

Apostolos I. Rikos, Jiaqi Hu, Themistoklis Charalambous, Karl Henrik JohannsonThu, 12 Ma⚡ eess

Synthesizing Interpretable Control Policies through Large Language Model Guided Search

Cet article propose une méthode novatrice utilisant des modèles de langage pour générer et faire évoluer des politiques de contrôle interprétables sous forme de programmes Python, offrant une alternative transparente et modifiable aux approches par réseaux de neurones pour des tâches dynamiques complexes comme le balancement d'un pendule ou la gestion d'une balle dans une coupe.

Carlo Bosio, Mark W. MuellerThu, 12 Ma⚡ eess

Robust targeted exploration for systems with non-stochastic disturbances

Cet article propose une nouvelle stratégie d'exploration ciblée pour les systèmes linéaires invariants dans le temps soumis à des perturbations non stochastiques à énergie bornée, utilisant un programme semidéfini pour garantir une précision d'estimation des paramètres sans hypothèse sur la distribution des perturbations.

Janani Venkatasubramanian, Johannes Köhler, Mark Cannon, Frank AllgöwerThu, 12 Ma⚡ eess

Modular Control of Discrete Event System for Modeling and Mitigating Power System Cascading Failures

Cet article propose une approche de contrôle supervisaire modulaire des systèmes à événements discrets, implémentée sur MATLAB et validée sur les réseaux IEEE 30, 118 et 300, afin de réduire la complexité computationnelle et d'améliorer la prédiction et l'atténuation des défaillances en cascade dans les systèmes électriques.

Wasseem Al-Rousan, Caisheng Wang, Feng LinThu, 12 Ma⚡ eess

Score Matching Diffusion Based Feedback Control and Planning of Nonlinear Systems

Cet article propose un cadre déterministe de contrôle basé sur l'appariement de scores et les processus de diffusion pour piloter la densité de probabilité de systèmes non linéaires vers une distribution cible, en transformant la synthèse de commande en la construction d'un processus inverse qui agit comme une loi de rétroaction de débruitage.

Karthik Elamvazhuthi, Darshan Gadginmath, Fabio PasqualettiThu, 12 Ma⚡ eess

Customized Interior-Point Methods Solver for Embedded Real-Time Convex Optimization

Cet article présente un solveur de programmation conique de second ordre (SOCP) personnalisé pour l'optimisation convexe temps réel embarquée, basé sur une méthode de points intérieurs primal-duale avec homogénéisation, capable de traiter directement des fonctions de coût quadratiques sans reformulation et généré automatiquement en code C sans dépendances externes pour surpasser les solveurs existants dans les applications de guidage et de contrôle.

Jae-Il Jang, Chang-Hun LeeThu, 12 Ma⚡ eess

Universal Dynamics with Globally Controlled Analog Quantum Simulators

Cet article établit les conditions nécessaires et suffisantes pour l'universalité des simulateurs quantiques analogiques à contrôle global, propose une méthode de contrôle optimal direct pour synthétiser des Hamiltoniens complexes sous contraintes matérielles, et démontre expérimentalement la réalisation d'interactions à trois corps et de dynamiques topologiques sur une plateforme d'atomes de Rydberg.

Hong-Ye Hu, Abigail McClain Gomez, Liyuan Chen, Aaron Trowbridge, Andy J. Goldschmidt, Zachary Manchester, Frederic T. Chong, Arthur Jaffe, Susanne F. YelinThu, 12 Ma⚛️ quant-ph

Event-Based Control via Sparsity-Promoting Regularization: A Rollout Approach with Performance Guarantees

Cet article propose une méthode de contrôle basée sur les événements utilisant une régularisation favorisant la parcimonie et un algorithme de déploiement pour équilibrer performance et fréquence d'actuation, tout en garantissant théoriquement la stabilité du système et des performances supérieures à un contrôle périodique.

Shumpei Nishida, Kunihisa OkanoThu, 12 Ma⚡ eess

Formation Control via Rotation Symmetry Constraints

Cet article présente une stratégie de contrôle de formation distribuée pour des systèmes multi-agents qui, en se basant uniquement sur des contraintes de symétrie de rotation et une fonction de potentiel minimale, permet d'atteindre des configurations planaires symétriques tout en assurant des manœuvres coordonnées de translation, de rotation et de mise à l'échelle.

Zamir Martinez, Daniel ZelazoThu, 12 Ma⚡ eess

A Predictive Flexibility Aggregation Method for Low Voltage Distribution System Control

Ce papier propose une méthode de contrôle prédictif et préservant la vie privée pour la gestion des réseaux de distribution basse tension, qui agrège en temps réel la flexibilité résidentielle via une optimisation multiparamétrique décentralisée et des schémas de planification opérationnelle.

Clément Moureau, Thomas Stegen, Mevludin Glavic, Bertrand CornélusseThu, 12 Ma⚡ eess

Analysis and Synthesis of Switched Optimization Algorithms

Ce travail propose une méthode d'analyse et de synthèse d'algorithmes d'optimisation discrets à convergence exponentielle certifiée, robustes aux dynamiques de réseau commutées incluant des retards temporels variables et des canaux instables, en résolvant des inégalités matricielles linéaires via des filtres de Zames-Falb.

Jared Miller, Fabian Jakob, Carsten Scherer, Andrea IannelliThu, 12 Ma⚡ eess

System-Theoretic Analysis of Dynamic Generalized Nash Equilibria -- Turnpikes and Dissipativity

Cet article établit un lien fondamental entre la dissipativité stricte et le phénomène de turnpike dans les équilibres de Nash généralisés dynamiques, en fournissant des conditions pour l'optimalité de l'état stationnaire et en concevant des pénalités terminales assurant la stabilité des trajectoires dans le cadre du contrôle prédictif basé sur la théorie des jeux.

Sophie Hall, Florian Dörfler, Timm FaulwasserThu, 12 Ma⚡ eess

Simplifying Preference Elicitation in Local Energy Markets: Combinatorial Clock Exchange

Ce papier propose un mécanisme de marché local d'énergie combinant l'échange en horloge combinatoire et l'apprentissage automatique pour simplifier l'expression des préférences complexes des prosumers et accélérer la découverte des prix grâce à un format intuitif et transparent.

Shobhit Singhal, Lesia MitridatiThu, 12 Ma⚡ eess

Safe and Optimal Learning from Preferences via Weighted Temporal Logic with Applications in Robotics and Formula 1

Cet article propose une méthode sûre et optimale pour apprendre à partir de préférences humaines en utilisant la logique temporelle pondérée (WSTL), transformant le problème d'apprentissage en un programme linéaire en nombres mixtes grâce à des techniques d'élagage et de transformation logarithmique, et validant son efficacité sur des applications robotiques et en Formule 1.

Ruya Karagulle, Cristian-Ioan Vasile, Necmiye OzayThu, 12 Ma⚡ eess

← Précédent Suivant →