Integrating Lagrangian Neural Networks into the Dyna Framework for Reinforcement Learning

Questo lavoro propone l'integrazione di reti neurali lagrangiane nel framework Dyna per il reinforcement learning basato su modelli, dimostrando che l'uso di ottimizzatori basati sulla stima dello stato accelera la convergenza e migliora l'efficienza rispetto ai metodi black-box tradizionali.

Shreya Das, Kundan Kumar, Muhammad Iqbal, Outi Savolainen, Dominik Baumann, Laura Ruotsalainen, Simo SärkkäTue, 10 Ma🤖 cs.LG

Behavioral Generative Agents for Power Dispatch and Auction

Questo articolo presenta evidenze preliminari sul fatto che gli agenti generativi basati su modelli linguistici di grandi dimensioni (LLM) possono superare la rigidità dei modelli matematici tradizionali per simulare il processo decisionale umano nella gestione della potenza e nelle aste, dimostrando come l'apprendimento in contesto (ICL) permetta di trasferire strategie comportamentali e riprodurre sia comportamenti razionali che deviazioni sistemiche in testbed energetici.

Shaoze Li, Justin S. Kim, Cong ChenTue, 10 Ma💻 cs

Input Dexterity and Output Negotiation in Feedback-Linearizable Nonlinear Systems

Questo lavoro introduce una tassonomia relativa al compito per gli attuatori nei sistemi non lineari linearizzabili, classificando gli ingressi come essenziali, ridondanti o di destrezza, e dimostra come gli ingressi di destrezza possano essere disattivati dinamicamente per negoziare tra compiti completi e ridotti mantenendo la linearizzazione esatta e garantendo transizioni senza transienti.

Mirko Mizzoni, Pieter van Goor, Barbara Bazzana, Antonio FranchiTue, 10 Ma🔢 math

Response time central-limit and failure rate estimation for stationary periodic rate monotonic real-time systems

Questo articolo propone un metodo per stimare i tempi di risposta e i tassi di guasto nei sistemi real-time periodici con priorità Rate Monotonic, basandosi su un'approssimazione della distribuzione dei tempi di risposta mediante una miscela di distribuzioni Inverse Gaussian e un algoritmo Expectation-Maximization adattato, la cui efficacia è dimostrata tramite simulazioni estensive.

Kevin Zagalo, Avner Bar-HenThu, 12 Ma⚡ eess

Max-Consensus with Deterministic Convergence in Directed Graphs with Unreliable Communication Links

Il paper presenta DMaC, un nuovo algoritmo distribuito a tempo finito che garantisce la convergenza esatta al massimo stato in reti dirette con collegamenti di comunicazione inaffidabili, sfruttando canali di feedback a banda stretta per un meccanismo di terminazione autonomo e dimostrando la sua efficacia in reti di sensori wireless.

Apostolos I. Rikos, Jiaqi Hu, Themistoklis Charalambous, Karl Henrik JohannsonThu, 12 Ma⚡ eess

Universal Dynamics with Globally Controlled Analog Quantum Simulators

Questo lavoro stabilisce le condizioni per l'universalità dei simulatori quantistici analogici con controllo globale, dimostrando sperimentalmente su array di atomi di Rydberg come il controllo diretto ottimizzi la sintesi di Hamiltoniani efficaci complessi e la dinamica topologica.

Hong-Ye Hu, Abigail McClain Gomez, Liyuan Chen, Aaron Trowbridge, Andy J. Goldschmidt, Zachary Manchester, Frederic T. Chong, Arthur Jaffe, Susanne F. YelinThu, 12 Ma⚛️ quant-ph

A Predictive Flexibility Aggregation Method for Low Voltage Distribution System Control

Questo articolo presenta un metodo di aggregazione predittiva della flessibilità a livello residenziale, combinato con un'ottimizzazione centralizzata, per realizzare uno schema di controllo in tempo reale e rispettoso della privacy dei sistemi di distribuzione a bassa tensione, riducendo i carichi computazionali online attraverso calcoli offline decentralizzati.

Clément Moureau, Thomas Stegen, Mevludin Glavic, Bertrand CornélusseThu, 12 Ma⚡ eess

System-Theoretic Analysis of Dynamic Generalized Nash Equilibria -- Turnpikes and Dissipativity

Questo studio analizza le traiettorie di equilibrio di Nash generalizzato dinamico da una prospettiva sistemica, dimostrando come la dissipatività stretta generi il fenomeno del turnpike, stabilendo un risultato inverso e proponendo penalità terminali lineari per garantire la convergenza verso l'equilibrio di stato stazionario, fornendo così le basi per l'analisi di stabilità e fattibilità ricorsiva nel controllo predittivo basato sulla teoria dei giochi.

Sophie Hall, Florian Dörfler, Timm FaulwasserThu, 12 Ma⚡ eess