A Globally Convergent Third-Order Newton Method via Unified Semidefinite Programming Subproblems

El artículo presenta el método ALMTON, una variante de Newton de tercer orden que logra convergencia global en optimización no convexa mediante subproblemas de programación semidefinida adaptativos, ofreciendo una complejidad de evaluación de O(ϵ2)O(\epsilon^{-2}) y un rendimiento superior frente a métodos de segundo orden y otras aproximaciones de tercer orden.

Yubo Cai, Wenqi Zhu, Coralia Cartis, Gioele ZardiniWed, 11 Ma🔢 math

Long-Run Conditional Value-at-Risk Reinforcement Learning

Este artículo propone un algoritmo de aprendizaje por refuerzo sin modelo que garantiza la convergencia casi segura y una tasa óptima de O(1/n)O(1/n) para la optimización de la Valor en Riesgo Condicional (CVaR) a largo plazo en procesos de decisión de Markov, utilizando una única trayectoria de muestra y extendiéndose a problemas de optimización media-CVaR.

Qixin Wang, Hao Cao, Jian-Qiang Hu, Mingjie Hu, Li XiaWed, 11 Ma🔢 math

Optimal Control in Age-Structured Populations: A Comparison of Rate-Control and Effort-Control

Este artículo compara los mecanismos de control de tasa y esfuerzo en poblaciones estructuradas por edad, demostrando mediante condiciones de optimalidad de Pontryagin que el control por esfuerzo introduce una acoplamiento no local en el sistema adjunto debido a su dependencia de la población total, lo que genera distinciones matemáticas y bioeconómicas fundamentales frente al control por tasa.

Jiguang Yu, Louis Shuo WangWed, 11 Ma🔢 math

Control and stabilization of cascade coupled systems: application to a 1-d heat and wave coupled system

Este artículo estudia la buena posición, el controlabilidad y la estabilización de sistemas acoplados en cascada, utilizando como ejemplo prototípico un sistema unidimensional de ecuaciones de calor y ondas, donde se demuestra la controlabilidad exacta y aproximada simultánea y se logra una estabilización polinómica mediante un control de retroalimentación basado en una ecuación de Sylvester dentro de un marco abstracto de sistemas lineales invariantes en el tiempo.

Lucas Davron, Pierre Lissy, Swann MarxWed, 11 Ma🔢 math

On the Width Scaling of Neural Optimizers Under Matrix Operator Norms I: Row/Column Normalization and Hyperparameter Transfer

Este artículo propone una nueva familia de optimizadores basados en normas de operadores normalizadas (como MOGA) que garantizan una estabilidad independiente del ancho de la red y permiten una transferencia efectiva de hiperparámetros, superando las limitaciones de métodos existentes como AdamW y Muon mediante una perspectiva geométrica de descenso de gradiente.

Ruihan Xu, Jiajin Li, Yiping LuWed, 11 Ma🤖 cs.LG

Bilevel Optimization and Heuristic Algorithms for Integrating Latent Demand into the Design of Large-Scale Transit Systems

Este artículo presenta un modelo de optimización bilevel y cinco algoritmos heurísticos eficientes para diseñar redes de transporte a gran escala que integran la demanda latente, demostrando mediante estudios de caso reales que estos métodos encuentran soluciones de alta calidad más rápido que los enfoques exactos mientras satisfacen propiedades clave de adopción.

Hongzhao Guan, Beste Basciftci, Pascal Van HentenryckTue, 10 Ma🔢 math

Erratum and original of Port-Hamiltonian structure of interacting particle systems and its mean-field limit

Este artículo presenta una corrección y la versión original de un estudio que deriva una formulación port-Hamiltoniana mínima para sistemas de partículas interactuantes, demuestra la preservación de dicha estructura en el límite de campo medio, identifica las condiciones necesarias para la convergencia y la compacidad relativa de las trayectorias, y ofrece nuevas perspectivas sobre la estabilidad uniforme y el acoplamiento de diferentes especies.

Jannik Daun, Daniel Jannik Happ, Birgit Jacob, Claudia TotzeckTue, 10 Ma🔢 math

New Heuristics for the Operation of an Ambulance Fleet under Uncertainty

Este artículo propone y evalúa nuevos algoritmos heurísticos y un enfoque de *rollout* basado en programación estocástica para optimizar la selección y reasignación de ambulancias bajo incertidumbre, demostrando que estas técnicas mejoran los tiempos de respuesta y son lo suficientemente rápidas para su implementación en tiempo real en servicios médicos de emergencia.

Vincent Guigues, Anton J. Kleywegt, Victor Hugo NascimentoTue, 10 Ma🔢 math

Landscape of Policy Optimization for Finite Horizon MDPs with General State and Action

Este artículo demuestra que, para una clase de procesos de decisión de Markov de horizonte finito con espacios generales de estado y acción, el paisaje de optimización de políticas satisface la condición PŁK, lo que garantiza la convergencia global de los métodos de gradiente de política a la política óptima con tasas no asintóticas y proporciona las primeras garantías de complejidad de muestra para sistemas de inventario y balances de efectivo estocásticos.

Xin Chen, Yifan Hu, Minda ZhaoTue, 10 Ma🤖 cs.LG

Robustness to Model Approximation, Model Learning From Data, and Sample Complexity in Wasserstein Regular MDPs

Este artículo analiza la robustez de los procesos de decisión de Markov bajo aproximación de modelos mediante la distancia de Wasserstein, cuantificando la pérdida de rendimiento al aplicar políticas óptimas de modelos aproximados a dinámicas reales y estableciendo límites de complejidad de muestra para aplicaciones en aprendizaje empírico y estimación de perturbaciones.

Yichen Zhou, Yanglei Song, Serdar YükselTue, 10 Ma🔢 math

A fresh look into variational analysis of C2\mathcal C^2-partly smooth functions

Este artículo ofrece una nueva perspectiva de análisis variacional sobre las funciones C2\mathcal C^2-parcialmente lisas, estableciendo su relación con la epi-diferenciabilidad estricta doble, calculando su segunda subderivada y aplicando estos resultados al análisis de estabilidad de ecuaciones generalizadas y a la aproximación de muestras promedio en programas estocásticos.

Nguyen T. V. Hang, Ebrahim SarabiTue, 10 Ma🔢 math

Minimax Linear Regulator Problems for Positive Systems

Este trabajo presenta soluciones explícitas para problemas de regulador lineal minimax en sistemas lineales invariantes en el tiempo positivos, abordando perturbaciones no negativas y acotadas mediante programación dinámica y un método de punto fijo para horizontes temporales finito e infinito, con aplicaciones demostradas en redes de gestión de agua a gran escala.

Alba Gurpegui, Mark Jeeninga, Emma Tegling, Anders RantzerTue, 10 Ma🔢 math