Integrating Lagrangian Neural Networks into the Dyna Framework for Reinforcement Learning

Este artigo propõe a integração de Redes Neurais Lagrangianas (LNNs) no framework Dyna para Aprendizado por Reforço baseado em Modelo, demonstrando que o uso de otimizadores baseados em estimativa de estado acelera a convergência e melhora a precisão das previsões de dinâmica ao impor leis físicas subjacentes.

Shreya Das, Kundan Kumar, Muhammad Iqbal, Outi Savolainen, Dominik Baumann, Laura Ruotsalainen, Simo SärkkäTue, 10 Ma🤖 cs.LG

Behavioral Generative Agents for Power Dispatch and Auction

Este artigo apresenta evidências iniciais de que agentes generativos baseados em modelos de linguagem (LLM) podem superar a rigidez dos modelos matemáticos tradicionais ao simular decisões humanas em despacho e leilões de energia, demonstrando que a aprendizagem em contexto (ICL) permite tanto a transferência de comportamentos estratégicos quanto a reprodução de desvios comportamentais sistemáticos em testes de gerenciamento de baterias e leilões de acesso à rede.

Shaoze Li, Justin S. Kim, Cong ChenTue, 10 Ma💻 cs

Input Dexterity and Output Negotiation in Feedback-Linearizable Nonlinear Systems

Este artigo apresenta uma taxonomia relativa à tarefa para entradas de atuadores em sistemas não lineares feedback-linearizáveis, classificando-as como essenciais, redundantes ou de destreza, e demonstra como entradas de destreza permitem a negociação unificada entre tarefas completas e reduzidas sem transientes nas saídas compartilhadas, ilustrado em uma plataforma aérea.

Mirko Mizzoni, Pieter van Goor, Barbara Bazzana, Antonio FranchiTue, 10 Ma🔢 math

Response time central-limit and failure rate estimation for stationary periodic rate monotonic real-time systems

Este artigo propõe um método para estimar as taxas de falha em sistemas de tempo real estáticos e periódicos com prioridade Rate Monotonic, utilizando uma aproximação da distribuição de tempos de resposta por meio de uma mistura de distribuições Inverse Gaussian e um algoritmo Expectation-Maximization adaptado, cuja eficácia é validada por simulações extensivas.

Kevin Zagalo, Avner Bar-HenThu, 12 Ma⚡ eess

Max-Consensus with Deterministic Convergence in Directed Graphs with Unreliable Communication Links

O artigo apresenta o DMaC, um algoritmo distribuído de tempo finito que garante a convergência exata para o consenso máximo em redes direcionadas com links de comunicação não confiáveis, incorporando um mecanismo de término totalmente distribuído e utilizando canais de feedback de erro livre de banda estreita para minimizar a sobrecarga.

Apostolos I. Rikos, Jiaqi Hu, Themistoklis Charalambous, Karl Henrik JohannsonThu, 12 Ma⚡ eess

Synthesizing Interpretable Control Policies through Large Language Model Guided Search

Este artigo propõe um método inovador que utiliza Grandes Modelos de Linguagem (LLMs) para guiar a busca evolutiva de políticas de controle interpretáveis, representadas como programas em linguagens padrão como Python, permitindo a geração de comportamentos complexos em sistemas dinâmicos com maior transparência e facilidade de ajuste humano em comparação com redes neurais tradicionais.

Carlo Bosio, Mark W. MuellerThu, 12 Ma⚡ eess

Customized Interior-Point Methods Solver for Embedded Real-Time Convex Optimization

Este artigo apresenta um solucionador otimizado de programação cônica de segunda ordem (SOCP) baseado em métodos de ponto interior, acompanhado de uma ferramenta de geração de código em C para aplicações de controle e orientação em tempo real, que supera os solucionadores existentes ao lidar diretamente com funções de custo quadráticas sem reformulação do problema e garantindo alocação estática completa em plataformas embarcadas.

Jae-Il Jang, Chang-Hun LeeThu, 12 Ma⚡ eess

Universal Dynamics with Globally Controlled Analog Quantum Simulators

Este artigo estabelece as condições teóricas para a universalidade de simuladores quânticos análogos com controle global, demonstra que pulsos aleatórios geram emaranhamento e aleatoriedade eficientes, e valida experimentalmente a síntese de interações efetivas complexas e dinâmicas topológicas em arrays de átomos de Rydberg através de um novo framework de controle quântico ótimo direto.

Hong-Ye Hu, Abigail McClain Gomez, Liyuan Chen, Aaron Trowbridge, Andy J. Goldschmidt, Zachary Manchester, Frederic T. Chong, Arthur Jaffe, Susanne F. YelinThu, 12 Ma⚛️ quant-ph

System-Theoretic Analysis of Dynamic Generalized Nash Equilibria -- Turnpikes and Dissipativity

Este artigo analisa equilíbrios de Nash generalizados dinâmicos sob uma perspectiva de teoria de sistemas, demonstrando a relação entre dissipatividade estrita e o fenômeno de turnpike, estabelecendo condições para a estabilidade do equilíbrio de estado estacionário e projetando penalidades terminais que garantem a convergência de trajetórias em jogos de horizonte finito.

Sophie Hall, Florian Dörfler, Timm FaulwasserThu, 12 Ma⚡ eess

Simplifying Preference Elicitation in Local Energy Markets: Combinatorial Clock Exchange

Este artigo propõe um mecanismo de mercado local de energia que combina o Troca Combinatória de Relógio com aprendizado de máquina para simplificar a elicitação de preferências de prosumidores, permitindo que expressem necessidades complexas de forma intuitiva sem necessidade de previsão de preços, enquanto acelera a convergência para preços de liquidação.

Shobhit Singhal, Lesia MitridatiThu, 12 Ma⚡ eess