Integrating Lagrangian Neural Networks into the Dyna Framework for Reinforcement Learning

Este trabajo propone un marco de aprendizaje por refuerzo basado en modelos (MBRL) que integra redes neuronales lagrangianas dentro de la arquitectura Dyna para garantizar el cumplimiento de las leyes físicas y mejorar la precisión de las predicciones, demostrando que el uso de optimizadores basados en estimación de estado acelera la convergencia en comparación con los métodos basados en gradiente estocástico.

Shreya Das, Kundan Kumar, Muhammad Iqbal, Outi Savolainen, Dominik Baumann, Laura Ruotsalainen, Simo SärkkäTue, 10 Ma🤖 cs.LG

Behavioral Generative Agents for Power Dispatch and Auction

Este artículo presenta evidencia inicial de que los agentes generativos impulsados por modelos de lenguaje grande pueden superar la rigidez de los modelos matemáticos tradicionales para modelar la toma de decisiones humanas en la despacho y subastas de energía, demostrando mediante experimentos de prueba de concepto que el aprendizaje en contexto permite tanto replicar estrategias racionales como capturar desviaciones conductuales sistemáticas.

Shaoze Li, Justin S. Kim, Cong ChenTue, 10 Ma💻 cs

Response time central-limit and failure rate estimation for stationary periodic rate monotonic real-time systems

Este artículo propone un método para estimar las tasas de fallo en sistemas de tiempo real estacionarios y periódicos con prioridad de tasa monotónica, utilizando una aproximación de la distribución de los tiempos de respuesta mediante una mezcla de distribuciones inversas gaussianas y un algoritmo EM adaptado, cuya eficacia se valida mediante simulaciones extensas.

Kevin Zagalo, Avner Bar-HenThu, 12 Ma⚡ eess

Max-Consensus with Deterministic Convergence in Directed Graphs with Unreliable Communication Links

El artículo presenta DMaC, un algoritmo distribuido de tiempo finito que garantiza la convergencia exacta al consenso máximo en redes dirigidas con enlaces de comunicación no fiables, incorporando un mecanismo de terminación autónomo y utilizando canales de retroalimentación de error libre de banda estrecha para minimizar la sobrecarga.

Apostolos I. Rikos, Jiaqi Hu, Themistoklis Charalambous, Karl Henrik JohannsonThu, 12 Ma⚡ eess

Score Matching Diffusion Based Feedback Control and Planning of Nonlinear Systems

Este artículo propone un marco de control basado en la coincidencia de puntuación de difusión para sistemas no lineales, que utiliza un proceso de difusión hacia adelante seguido de una ley de retroalimentación determinista de "desruido" para guiar la densidad de probabilidad del sistema hacia una distribución objetivo, ofreciendo una alternativa tratable al control no lineal con garantías teóricas para sistemas sin deriva y lineales invariantes en el tiempo.

Karthik Elamvazhuthi, Darshan Gadginmath, Fabio PasqualettiThu, 12 Ma⚡ eess

Customized Interior-Point Methods Solver for Embedded Real-Time Convex Optimization

Este artículo presenta un solver personalizado de programación cónica de segundo orden basado en el método de punto interior primal-dual y un marco de incrustación homogénea, diseñado mediante generación de código en C para optimización convexa en tiempo real en sistemas embebidos, destacando su capacidad para manejar funciones de costo cuadráticas sin reformulación y su superior rendimiento en aplicaciones de guía y control.

Jae-Il Jang, Chang-Hun LeeThu, 12 Ma⚡ eess

Universal Dynamics with Globally Controlled Analog Quantum Simulators

Este trabajo establece las condiciones teóricas para la universalidad en simuladores cuánticos análogos con control global, demuestra su capacidad para generar dinámicas complejas y validación experimental mediante control óptimo directo en átomos de Rydberg, logrando interacciones de tres cuerpos y dinámicas topológicas.

Hong-Ye Hu, Abigail McClain Gomez, Liyuan Chen, Aaron Trowbridge, Andy J. Goldschmidt, Zachary Manchester, Frederic T. Chong, Arthur Jaffe, Susanne F. YelinThu, 12 Ma⚛️ quant-ph

A Predictive Flexibility Aggregation Method for Low Voltage Distribution System Control

Este artículo presenta un método de control predictivo y privado para la gestión en tiempo real de sistemas de distribución de baja tensión, que agrega la flexibilidad residencial mediante optimización multiparamétrica descentralizada y se valida en una red de 43 barras demostrando su eficacia frente a enfoques centralizados y agnósticos al futuro.

Clément Moureau, Thomas Stegen, Mevludin Glavic, Bertrand CornélusseThu, 12 Ma⚡ eess

Analysis and Synthesis of Switched Optimization Algorithms

Este trabajo presenta un marco para el análisis y síntesis de algoritmos de optimización discretos que garantizan tasas de convergencia exponencial certificadas y robustez frente a dinámicas de red conmutadas, como retardos variables y canales inestables, mediante la resolución de desigualdades matriciales lineales y el uso de coeficientes de filtros Zames-Falb.

Jared Miller, Fabian Jakob, Carsten Scherer, Andrea IannelliThu, 12 Ma⚡ eess

System-Theoretic Analysis of Dynamic Generalized Nash Equilibria -- Turnpikes and Dissipativity

Este artículo analiza los equilibrios de Nash generalizados dinámicos desde una perspectiva de teoría de sistemas, demostrando la relación recíproca entre la disipatividad estricta y el fenómeno de la autopista, estableciendo condiciones para el punto de operación óptimo y diseñando penalizaciones terminales que garantizan la estabilidad y convergencia en la aplicación de MPC basado en teoría de juegos.

Sophie Hall, Florian Dörfler, Timm FaulwasserThu, 12 Ma⚡ eess

Simplifying Preference Elicitation in Local Energy Markets: Combinatorial Clock Exchange

Este artículo presenta un mecanismo de mercado local de energía que fusiona el intercambio de relojes combinatorio con técnicas de aprendizaje automático para simplificar la elicitación de preferencias de los prosumidores, permitiéndoles expresar necesidades complejas de manera intuitiva sin necesidad de predecir precios ni utilizar formatos de oferta complicados.

Shobhit Singhal, Lesia MitridatiThu, 12 Ma⚡ eess

Safe and Optimal Learning from Preferences via Weighted Temporal Logic with Applications in Robotics and Formula 1

Este artículo presenta un enfoque seguro y óptimo para el aprendizaje a partir de preferencias humanas en sistemas autónomos, utilizando la Lógica Temporal de Señales Ponderada (WSTL) transformada en un programa lineal entero mixto mediante poda estructural y transformaciones logarítmicas, lo que garantiza la seguridad en dominios críticos como la navegación robótica y las carreras de Fórmula 1.

Ruya Karagulle, Cristian-Ioan Vasile, Necmiye OzayThu, 12 Ma⚡ eess