A Globally Convergent Third-Order Newton Method via Unified Semidefinite Programming Subproblems

O artigo propõe o método ALMTON, uma nova abordagem de otimização não convexa que utiliza subproblemas de programação semidefinida adaptativa para garantir convergência global e complexidade O(ϵ2)O(\epsilon^{-2}) sem recorrer a termos de regularização quárticos, superando em consistência e eficiência as implementações de terceira ordem existentes.

Yubo Cai, Wenqi Zhu, Coralia Cartis, Gioele ZardiniWed, 11 Ma🔢 math

Optimal Control in Age-Structured Populations: A Comparison of Rate-Control and Effort-Control

Este artigo investiga as dinâmicas e a colheita ótima de populações estruturadas por idade, contrastando os mecanismos de controle por taxa (remoção aditiva) e por esforço (mortalidade multiplicativa dependente do tamanho agregado), demonstrando como a dependência do estoque total no segundo modelo altera estruturalmente o sistema de otimalidade ao introduzir um termo de acoplamento não local na equação adjunta.

Jiguang Yu, Louis Shuo WangWed, 11 Ma🔢 math

Control and stabilization of cascade coupled systems: application to a 1-d heat and wave coupled system

Este artigo investiga a bem-postura, controlabilidade e estabilização de sistemas em cascata acoplados, utilizando como exemplo prototípico um sistema de equações de calor e onda unidimensionais, e demonstra resultados de controlabilidade exata simultânea e estabilização polinomial dentro de uma estrutura abstrata de sistemas lineares invariantes no tempo.

Lucas Davron, Pierre Lissy, Swann MarxWed, 11 Ma🔢 math

On the Width Scaling of Neural Optimizers Under Matrix Operator Norms I: Row/Column Normalization and Hyperparameter Transfer

Este artigo propõe uma nova família de normas de operador normalizadas por média que permitem o controle independente da largura das constantes de Lipschitz e suavidade, resultando no otimizador MOGA, que garante transferência estável de taxas de aprendizado entre diferentes larguras de modelo e supera o Muon em regimes de baixa perda e grandes tokens.

Ruihan Xu, Jiajin Li, Yiping LuWed, 11 Ma🤖 cs.LG

Bilevel Optimization and Heuristic Algorithms for Integrating Latent Demand into the Design of Large-Scale Transit Systems

Este artigo propõe um modelo de otimização bilevel e cinco algoritmos heurísticos eficientes para o projeto de redes de transporte em grande escala que integram a demanda latente, demonstrando por meio de estudos de caso reais que essas heurísticas encontram soluções de alta qualidade mais rapidamente do que abordagens exatas, ao mesmo tempo que satisfazem propriedades desejáveis de adoção pelos usuários.

Hongzhao Guan, Beste Basciftci, Pascal Van HentenryckTue, 10 Ma🔢 math

Cost-Driven Representation Learning for Linear Quadratic Gaussian Control: Part I

Este artigo estabelece garantias de amostragem finita para um método de aprendizado de representação de estado orientado a custos que, ao prever custos multietapa sem modelar observações ou ações, permite encontrar controladores e representações latentes quase ótimos para problemas de controle Linear Quadrático Gaussiano (LQG) de horizonte finito.

Yi Tian, Kaiqing Zhang, Russ Tedrake, Suvrit SraTue, 10 Ma🤖 cs.LG

Distributional stability of sparse inverse covariance matrix estimators

Este artigo investiga a estabilidade distribucional de estimadores esparsos da matriz de precisão sob dados contaminados, derivando limites de Lipschitz locais explícitos para a distância entre distribuições medidas pela métrica de Kantorovich e apresentando resultados análogos para estimadores de covariância e autovalores, além de discussões sobre aplicações e experimentos numéricos.

Renjie Chen, Huifu Xu, Henryk ZähleTue, 10 Ma🔢 math

Landscape of Policy Optimization for Finite Horizon MDPs with General State and Action

Este artigo estabelece que, para uma classe de MDPs de horizonte finito com espaços de estado e ação gerais, o problema de otimização de políticas satisfaz a condição Polyak-Łojasiewicz-Kurdyka, garantindo a convergência global não assintótica de métodos de gradiente de política com complexidade de amostra O~(ϵ1)\tilde{\mathcal{O}}(\epsilon^{-1}) e fornecendo as primeiras garantias teóricas para sistemas de inventário e saldos de caixa estocásticos.

Xin Chen, Yifan Hu, Minda ZhaoTue, 10 Ma🤖 cs.LG

Robustness to Model Approximation, Model Learning From Data, and Sample Complexity in Wasserstein Regular MDPs

Este artigo analisa a robustez de políticas ótimas em processos de decisão de Markov sob aproximação de modelo baseada na distância de Wasserstein, estabelecendo limites de perda de desempenho e complexidade de amostragem que são particularmente úteis para aprendizado empírico de modelos e distribuições de ruído onde critérios de convergência mais fortes não se aplicam.

Yichen Zhou, Yanglei Song, Serdar YükselTue, 10 Ma🔢 math

A fresh look into variational analysis of C2\mathcal C^2-partly smooth functions

Este trabalho oferece uma nova perspectiva de análise variacional para funções parcialmente suaves de classe C2\mathcal C^2, estabelecendo sua relação com a epi-diferenciabilidade estrita de segunda ordem, calculando sua segunda subderivada e demonstrando aplicações na análise de estabilidade de equações generalizadas e no método de aproximação média amostral para programas estocásticos.

Nguyen T. V. Hang, Ebrahim SarabiTue, 10 Ma🔢 math