A Novel Hybrid Heuristic-Reinforcement Learning Optimization Approach for a Class of Railcar Shunting Problems

Este artículo presenta un marco híbrido novedoso que combina heurísticas específicas del ferrocarril con aprendizaje por refuerzo (Q-learning) para optimizar eficientemente la clasificación de vagones en patios ferroviarios, abordando tanto configuraciones de acceso unilateral como bilateral mediante la descomposición del problema y la reducción del espacio de estados.

Ruonan Zhao, Joseph GeunesMon, 09 Ma🤖 cs.LG

Decision-dependent distributionally robust standard quadratic optimization with Wasserstein ambiguity

Este artículo presenta un enfoque de optimización cuadrática estándar robusta distribucionalmente bajo incertidumbre de datos, demostrando la equivalencia del problema con una instancia determinista modificada bajo la distancia de Wasserstein y validando el método mediante garantías de rendimiento fuera de la muestra y experimentos.

Immanuel M. Bomze, Daniel de Vicente, Abdel Lisser, Heng ZhangMon, 09 Ma🔢 math

Mean-field games with unbounded controls: a weak formulation approach to global solutions

El artículo establece la existencia de equilibrios para una clase de juegos de campo medio no markovianos con controles no acotados mediante una formulación débil, basándose en nuevos resultados de existencia y estabilidad para ecuaciones diferenciales estocásticas hacia atrás de McKean-Vlasov de crecimiento cuadrático que eliminan las restricciones de acotación en los parámetros del modelo y el horizonte temporal.

Ulrich Horst, Takashi SatoMon, 09 Ma🔢 math

Nonlinear Conjugate Gradient Method for Multiobjective Optimization Problems of Interval-Valued Maps

Este artículo propone un algoritmo de gradiente conjugado no lineal con búsqueda de línea de Wolfe para encontrar puntos críticos de Pareto en problemas de optimización multiobjetivo sin restricciones con mapas de valores intervalares, demostrando su convergencia global para varios parámetros y validándolo mediante pruebas numéricas.

Tapas Mondal, Debdas Ghosh, Jingxin Liu, Jie LiMon, 09 Ma🔢 math

Bayesian Linear Programming under Learned Uncertainty: Posterior Feasibility Guarantees, Scenario Certification, and Applications

Este artículo presenta un marco bayesiano para la programación lineal que integra la incertidumbre aprendida de los datos mediante garantías de factibilidad posterior, ofreciendo estrategias computacionales y procedimientos de certificación que mejoran la seguridad y la interpretabilidad de las decisiones en comparación con los enfoques tradicionales.

Debashis ChatterjeeMon, 09 Ma🔢 math

Newton Method for Multiobjective Optimization Problems of Interval-Valued Maps

Este artículo propone un método basado en Newton para resolver problemas de optimización multiobjetivo con mapas de valores intervalares, estableciendo la relación entre puntos óptimos de Pareto débiles y críticos, y demostrando la convergencia del algoritmo propuesto mediante experimentos numéricos y su aplicación en optimización de carteras con incertidumbre intervalar.

Tapas Mondal, Debdas Ghosh, Do Sang KimMon, 09 Ma🔢 math

A Hierarchical Bayesian Dynamic Game for Competitive Inventory and Pricing under Incomplete Information: Learning, Credible Risk, and Equilibrium

Este artículo presenta un juego dinámico bayesiano jerárquico para la gestión competitiva de inventarios y precios bajo información incompleta, que integra el aprendizaje sobre la demanda y las características del rival con un criterio de riesgo creíble para lograr un equilibrio conservador robusto ante la incertidumbre.

Debashis ChatterjeeMon, 09 Ma🔢 math

Policy Iteration Achieves Regularized Equilibrium under Time Inconsistency

El artículo presenta un algoritmo de iteración de políticas que garantiza la convergencia exponencial a una política de equilibrio regularizada para problemas de control estocástico con inconsistencia temporal, resolviendo un sistema de ecuaciones de Hamilton-Jacobi-Bellman exploratorias no locales y demostrando la existencia y unicidad global de su solución clásica.

Yu-Jui Huang, Xiang Yu, Keyu ZhangMon, 09 Ma🔢 math

General Bounds on Functionals of the Lifetime under Life Table Constraints

El artículo presenta un marco robusto para la gestión del riesgo de mortalidad en seguros de vida que deriva cotas superiores e inferiores para funcionales de la duración de la vida, permitiendo calcular los valores de contratos en los escenarios peor y mejor caso compatibles con las tablas de vida observadas, tanto bajo trayectorias de mortalidad estrictamente consistentes como bajo una formulación relajada que permite desviaciones esperadas.

Jean-Loup Dupret, Edouard MotteMon, 09 Ma🔢 math

Transposition Approach to Optimal Control of McKean-Vlasov SPDEs

Este artículo establece un principio de máximo estocástico de tipo Pontryagin para problemas de control óptimo de ecuaciones diferenciales estocásticas parciales de McKean-Vlasov con conjuntos de control no convexos, utilizando variaciones puntuales y una ecuación diferencial estocástica parcial hacia atrás adjunta que incorpora derivadas de Lions respecto a medidas de probabilidad.

Liangying Chen, Wilhelm StannatMon, 09 Ma🔢 math

Solving the Line-Based Dial-a-Ride Problem by Generating Stopping Patterns

Este artículo presenta un nuevo enfoque basado en patrones de parada para resolver el problema de transporte tipo dial-a-ride en líneas sin ventanas de tiempo, mediante una formulación MILP y un algoritmo de branch-and-price que, junto con una heurística en el nodo raíz, ofrece soluciones de alta calidad y escalables para instancias grandes en tiempos reducidos.

Antonio Lauerbach, Sven Mallach, Kendra Reiter, Marie Schmidt, Michael StiglmayrMon, 09 Ma🔢 math

Computing Stationary Distribution via Dirichlet-Energy Minimization by Coordinate Descent

El artículo presenta una formulación basada en optimización del algoritmo "Red Light Green Light" para calcular distribuciones estacionarias de cadenas de Markov grandes, lo que clarifica su comportamiento, establece una convergencia exponencial para ciertas cadenas y sugiere estrategias de programación para acelerar la convergencia.

Konstantin Avrachenkov, Lorenzo Gregoris, Nelly LitvakMon, 09 Ma🔢 math

Higher-Order Normality and No-Gap Conditions in Impulsive Control with L1L^1-Control Topology

Este artículo establece que una noción de normalidad de orden superior, basada en corchetes de Lie iterados, es suficiente para garantizar la ausencia de brecha de infimum en extensiones impulsivas de sistemas afines al control bajo una topología local definida por la distancia L1L^1 entre controles, superando limitaciones de enfoques previos basados en la topología LL^\infty.

Monica Motta, Michele Palladino, Franco RampazzoMon, 09 Ma🔢 math

The Popov's Algorithm with Optimal Bounded Stepsize for Generalized Monotone Variational Inequalities

Este artículo demuestra que el límite superior del paso de 12L\frac{1}{2L} para el algoritmo de Popov es óptimo en el caso restringido, mientras que para el caso no restringido se puede ampliar a 13L\frac{1}{\sqrt{3}L}, estableciendo la optimalidad de ambos límites mediante un nuevo análisis de función tipo Lyapunov para desigualdades variacionales monótonas generalizadas.

Nhung Hong Nguyen, Thanh Quoc Trinh, Phan Tu VuongMon, 09 Ma🔢 math

Low-rank optimization methods based on projected projected-gradient descent that accumulate at Bouligand stationary points

Este artículo propone dos métodos de primer orden basados en la descenso de gradiente proyectado que garantizan que sus puntos de acumulación sean estacionarios de Bouligand para la optimización de funciones diferenciables sobre variedades de matrices de rango limitado, destacando por su diseño eficiente, bajo costo computacional y sólidas propiedades de convergencia teórica.

Guillaume Olikier, Kyle A. Gallivan, P. -A. AbsilFri, 13 Ma🔢 math