math.OC artigos | Gist.Science

A Novel Hybrid Heuristic-Reinforcement Learning Optimization Approach for a Class of Railcar Shunting Problems

Este artigo apresenta um novo framework híbrido que combina heurísticas específicas do setor ferroviário com aprendizado por reforço (Q-learning) para otimizar a formação de trens em pátios de manobra, decompondo problemas complexos de acesso bilateral com duas locomotivas em subproblemas mais simples de acesso unilateral.

Ruonan Zhao, Joseph GeunesMon, 09 Ma🤖 cs.LG

Decision-dependent distributionally robust standard quadratic optimization with Wasserstein ambiguity

Este artigo propõe uma abordagem de otimização quadrática padrão robusta distribucionalmente baseada na distância de Wasserstein para lidar com incertezas na matriz de dados, demonstrando sua equivalência a uma instância determinística modificada e fornecendo garantias de desempenho fora da amostra.

Immanuel M. Bomze, Daniel de Vicente, Abdel Lisser, Heng ZhangMon, 09 Ma🔢 math

Mean-field games with unbounded controls: a weak formulation approach to global solutions

Este artigo estabelece a existência de equilíbrio para uma classe de jogos de campo médio não markovianos com controles ilimitados, utilizando uma formulação fraca e novos resultados sobre EDPs estocásticas de McKean-Vlasov com crescimento quadrático, sem impor restrições de limitação aos parâmetros do modelo ou ao horizonte temporal.

Ulrich Horst, Takashi SatoMon, 09 Ma🔢 math

A Lock-Free Work-Stealing Algorithm for Bulk Operations

Este artigo apresenta uma nova fila de roubo de trabalho sem bloqueio otimizada para um framework mestre-trabalhador em solvers de programação inteira mista, que suporta operações em lote nativas e demonstra desempenho superior em latência e escalabilidade em comparação com implementações existentes como a do C++ Taskflow.

Raja Sai Nandhan Yadav Kataru, Danial Davarnia, Ali JannesariMon, 09 Ma🔢 math

On Koopman Resolvents and Frequency Response of Nonlinear Systems

Este artigo propõe uma nova formulação da resposta em frequência para sistemas não lineares no quadro do operador de Koopman, generalizando a abordagem clássica de sistemas LTI através da transformada de Laplace e da teoria de resolutas, permitindo a construção de diagramas de Bode e estabelecendo condições suficientes para a existência dessa resposta em três classes de dinâmicas.

Yoshihiko Susuki, Natsuki Katayama, Alexandre Mauroy, Igor MezicMon, 09 Ma🔢 math

Nonlinear Conjugate Gradient Method for Multiobjective Optimization Problems of Interval-Valued Maps

Este artigo propõe um algoritmo de gradiente conjugado não linear com busca linear de Wolfe para encontrar pontos críticos de Pareto em problemas de otimização multiobjetivo com mapas de valores intervalares, demonstrando sua convergência global para quatro variantes de parâmetros e validando-o experimentalmente.

Tapas Mondal, Debdas Ghosh, Jingxin Liu, Jie LiMon, 09 Ma🔢 math

Bayesian Linear Programming under Learned Uncertainty: Posterior Feasibility Guarantees, Scenario Certification, and Applications

Este artigo propõe uma estrutura bayesiana para programação linear que integra a aprendizagem de incertezas a partir de dados com garantias de viabilidade pós-eriores, oferecendo estratégias computacionais e certificações que superam as abordagens clássicas em segurança e interpretabilidade científica.

Debashis ChatterjeeMon, 09 Ma🔢 math

Newton Method for Multiobjective Optimization Problems of Interval-Valued Maps

Este artigo propõe um método baseado em Newton para resolver problemas de otimização multiobjetivo com intervalos, estabelecendo a relação entre pontos de Pareto fracos e críticos, desenvolvendo um algoritmo com busca linear do tipo Armijo que converge para pontos críticos e validando sua eficácia através de experimentos numéricos e aplicação em otimização de carteiras com incerteza intervalar.

Tapas Mondal, Debdas Ghosh, Do Sang KimMon, 09 Ma🔢 math

A Hierarchical Bayesian Dynamic Game for Competitive Inventory and Pricing under Incomplete Information: Learning, Credible Risk, and Equilibrium

Este artigo propõe um jogo dinâmico bayesiano hierárquico para gestão competitiva de inventário e preços sob informação incompleta, integrando aprendizagem sobre a demanda, atualização estratégica de crenças sobre os rivais e um critério de risco credível para obter um equilíbrio conservador robusto, cuja eficácia é validada por simulações e uma aplicação em dados biológicos.

Debashis ChatterjeeMon, 09 Ma🔢 math

Policy Iteration Achieves Regularized Equilibrium under Time Inconsistency

Este artigo propõe um algoritmo de iteração de políticas que converge exponencialmente para uma política de equilíbrio regularizada em problemas de controle estocástico com inconsistência temporal, demonstrando simultaneamente a existência e unicidade global de soluções clássicas para a equação de Hamilton-Jacobi-Bellman de equilíbrio exploratória.

Yu-Jui Huang, Xiang Yu, Keyu ZhangMon, 09 Ma🔢 math

General Bounds on Functionals of the Lifetime under Life Table Constraints

Este artigo desenvolve um novo quadro robusto para a gestão de riscos de mortalidade em seguros de vida ao derivar limites superiores e inferiores para funcionais da duração da vida que são compatíveis com tabelas de vida observadas, permitindo quantificar o impacto de desvios nas taxas de mortalidade sobre os valores dos contratos sem depender de suposições específicas sobre a distribuição de óbitos entre idades inteiras.

Jean-Loup Dupret, Edouard MotteMon, 09 Ma🔢 math

Transposition Approach to Optimal Control of McKean-Vlasov SPDEs

Este artigo estabelece um princípio de máximo estocástico do tipo Pontryagin para problemas de controle ótimo de equações diferenciais estocásticas parciais de McKean-Vlasov com conjuntos de controle não convexos, utilizando variações pontuais e uma equação diferencial estocástica parcial reversa adjunta que incorpora derivadas de Lions em relação às medidas de probabilidade.

Liangying Chen, Wilhelm StannatMon, 09 Ma🔢 math

Gradient Flow Polarizes Softmax Outputs towards Low-Entropy Solutions

O artigo demonstra que o fluxo de gradiente em modelos de softmax com valores inerentemente direciona a otimização para soluções de baixa entropia, oferecendo uma explicação teórica para fenômenos empíricos como "attention sinks" e ativações massivas em transformers.

Aditya Varre, Mark Rofin, Nicolas FlammarionMon, 09 Ma🤖 cs.LG

Solving the Line-Based Dial-a-Ride Problem by Generating Stopping Patterns

Este artigo apresenta um novo modelo de programação linear inteira mista e um algoritmo de branch-and-price para resolver o problema de dial-a-ride baseado em linhas sem restrições temporais, utilizando padrões de parada para gerar soluções eficientes e escaláveis para instâncias de grande porte.

Antonio Lauerbach, Sven Mallach, Kendra Reiter, Marie Schmidt, Michael StiglmayrMon, 09 Ma🔢 math

Intrinsic Information Flow in Structureless NP Search

O artigo propõe uma reinterpretação da descoberta de testemunhas em problemas NP sob uma ótica teórica da informação, demonstrando que, no modelo "psocid" sem estrutura, a redução da incerteza necessária para a recuperação confiável exige uma quantidade de informação que excede em muito a capacidade de aquisição das consultas de igualdade, revelando assim uma origem informacional fundamental para a complexidade exponencial da busca.

Jing-Yuan WeiMon, 09 Ma🔢 math

Adaptive Lipschitz-Free Conditional Gradient Methods for Stochastic Composite Nonconvex Optimization

Este artigo apresenta o ALFCG, o primeiro framework adaptativo e livre de projeção para minimização estocástica não convexa que dispensa constantes de suavidade globais e busca linear, utilizando um acumulador auto-normalizado para estimar a suavidade local e alcançar complexidades de iteração ótimas próximas de $\mathcal{O}(\epsilon^{-2})$ em cenários de baixo ruído.

Ganzhao YuanMon, 09 Ma🤖 cs.LG

Computing Stationary Distribution via Dirichlet-Energy Minimization by Coordinate Descent

O artigo apresenta uma formulação baseada em otimização do algoritmo "Red Light Green Light" (RLGL) para calcular distribuições estacionárias de grandes cadeias de Markov, esclarecendo seu comportamento, estabelecendo convergência exponencial para uma classe de cadeias e sugerindo estratégias práticas de agendamento para acelerar a convergência.

Konstantin Avrachenkov, Lorenzo Gregoris, Nelly LitvakMon, 09 Ma🔢 math

Higher-Order Normality and No-Gap Conditions in Impulsive Control with $L^1$ -Control Topology

Este artigo demonstra que uma noção de normalidade de ordem superior, baseada em colchetes de Lie iterados, é suficiente para evitar a existência de lacunas de infimum em extensões impulsivas de sistemas controlados afins sob a topologia local $L^1$ , superando limitações de abordagens anteriores que utilizavam a distância $L^\infty$ .

Monica Motta, Michele Palladino, Franco RampazzoMon, 09 Ma🔢 math

The Popov's Algorithm with Optimal Bounded Stepsize for Generalized Monotone Variational Inequalities

O artigo demonstra que o limite superior do passo de $\frac{1}{2L}$ para o algoritmo de Popov é estrito no caso restrito, mas pode ser ampliado para $\frac{1}{\sqrt{3}L}$ no caso irrestrito, provando a otimalidade de ambos os limites através de uma nova função do tipo Lyapunov.

Nhung Hong Nguyen, Thanh Quoc Trinh, Phan Tu VuongMon, 09 Ma🔢 math

Low-rank optimization methods based on projected projected-gradient descent that accumulate at Bouligand stationary points

Este artigo propõe dois métodos de otimização de primeira ordem baseados em descida de gradiente projetada para minimizar funções diferenciáveis em variedades de matrizes de posto limitado, garantindo que seus pontos de acumulação sejam estacionários de Bouligand, a condição mais forte para otimalidade local nesse contexto não convexo.

Guillaume Olikier, Kyle A. Gallivan, P. -A. AbsilFri, 13 Ma🔢 math

← Anterior Próximo →

math.OC