math.OC articles | Gist.Science

Gradient Flow Polarizes Softmax Outputs towards Low-Entropy Solutions

Cet article démontre que le flot de gradient sur les modèles softmax à valeurs polarise intrinsèquement les sorties vers des solutions à faible entropie, offrant ainsi une explication théorique à des phénomènes empiriques des transformateurs tels que les « attention sinks » et les activations massives.

Aditya Varre, Mark Rofin, Nicolas Flammarion2026-03-09🤖 cs.LG

Solving the Line-Based Dial-a-Ride Problem by Generating Stopping Patterns

Cet article propose une nouvelle formulation MILP et un algorithme de branchement et génération de colonnes pour résoudre le problème de transport à la demande sur ligne sans contraintes temporelles (liDARP sans TW) en générant des motifs d'arrêt, démontrant ainsi l'efficacité d'une heuristique de nœud racine capable de traiter de grandes instances avec des écarts de solution inférieurs à 5 % en moins de 15 minutes.

Antonio Lauerbach, Sven Mallach, Kendra Reiter, Marie Schmidt, Michael Stiglmayr2026-03-09🔢 math

Intrinsic Information Flow in Structureless NP Search

En réinterprétant la découverte de témoins NP sous un angle informationnel via le modèle « psocid », ce papier démontre que l'absence de structure dans l'espace de recherche limite l'information acquise par les requêtes d'égalité à un niveau insuffisant pour une récupération fiable, révélant ainsi une origine informationnelle fondamentale de la complexité exponentielle de la recherche.

Jing-Yuan Wei2026-03-09🔢 math

Adaptive Lipschitz-Free Conditional Gradient Methods for Stochastic Composite Nonconvex Optimization

Ce papier propose ALFCG, le premier cadre adaptatif sans projection pour l'optimisation non convexe composite stochastique qui, sans nécessiter de constantes de régularité globales ni de recherche de ligne, atteint des taux de convergence optimaux en réduisant l'impact du bruit tout en surpassant les méthodes de gradient conditionnel de l'état de l'art.

Ganzhao Yuan2026-03-09🤖 cs.LG

Computing Stationary Distribution via Dirichlet-Energy Minimization by Coordinate Descent

Ce papier présente une formulation par optimisation de l'algorithme « Red Light Green Light » pour le calcul des distributions stationnaires de grandes chaînes de Markov, clarifiant son comportement, établissant sa convergence exponentielle pour une classe de chaînes et suggérant des stratégies d'accélération pratiques.

Konstantin Avrachenkov, Lorenzo Gregoris, Nelly Litvak2026-03-09🔢 math

Higher-Order Normality and No-Gap Conditions in Impulsive Control with $L^1$ -Control Topology

Cet article établit que, pour les systèmes affines en contrôle avec extensions impulsionnelles, une notion de normalité d'ordre supérieur basée sur les crochets de Lie itérés suffit à garantir l'absence de « gap » d'infimum sous une topologie locale définie par la distance $L^1$ entre les contrôles, comblant ainsi une lacune laissée par les résultats antérieurs basés sur la topologie $L^\infty$ des trajectoires.

Monica Motta, Michele Palladino, Franco Rampazzo2026-03-09🔢 math

The Popov's Algorithm with Optimal Bounded Stepsize for Generalized Monotone Variational Inequalities

Cet article démontre que la borne supérieure de pas $\frac{1}{2L}$ pour l'algorithme de Popov est optimale pour les inégalités variationnelles contraintes, tandis que cette borne peut être étendue de manière optimale à $\frac{1}{\sqrt{3}L}$ dans le cas non contraint, grâce à une nouvelle fonction de type Lyapunov.

Nhung Hong Nguyen, Thanh Quoc Trinh, Phan Tu Vuong2026-03-09🔢 math

Differentially Private Formation Control: Privacy and Network Co-Design

Cet article propose un cadre de co-conception pour la formation de systèmes multi-agents qui joint la topologie de communication et les niveaux de confidentialité différentielle afin d'optimiser les compromis entre la protection de la vie privée et la performance du système.

Calvin Hawkins, Matthew Hale2026-03-06🔢 math

The Generalized Multiplicative Gradient Method for A Class of Convex Optimization Problems Over Symmetric Cones

Cet article présente et analyse la méthode du gradient multiplicatif généralisé (GMG), qui résout une classe de problèmes d'optimisation convexe sur les cônes symétriques avec une complexité de convergence de $O(1/k)$ , surpassant ou égalant d'autres méthodes du premier ordre sur diverses applications telles que la tomographie par émission de positons et la conception D-optimale.

Renbo Zhao2026-03-06🔢 math

Distributionally Robust Airport Ground Holding Problem under Wasserstein Ambiguity Sets

Cet article propose un cadre robuste de distribution pour le problème de maintien au sol des aéronefs, intégrant un nouvel algorithme de bisection duale et de récupération primale qui accélère considérablement la résolution tout en améliorant la résilience des décisions face aux incertitudes de capacité aéroportuaire.

Haochen Wu, Alexander S. Estes, Max Z. Li2026-03-06🔢 math

Learning Risk Preferences in Markov Decision Processes: an Application to the Fourth Down Decision in the National Football League

En modélisant les décisions de quatrième down de l'NFL comme un processus de décision markovien résolu par optimisation inverse, cette étude révèle que les entraîneurs adoptent des préférences de risque conservatrices qui s'atténuent dans le demi-terrain adverse et évoluent vers plus de tolérance au risque au fil du temps.

Nathan Sandholtz, Lucas Wu, Martin Puterman + 1 more2026-03-06🔢 math

Zeroth-Order primal-dual Alternating Projection Gradient Algorithms for Nonconvex Minimax Problems with Coupled linear Constraints

Cet article propose deux algorithmes de gradient alterné primal-dual d'ordre zéro, ZO-PDAPG et ZO-RMPDPG, pour résoudre des problèmes minimax non convexes avec contraintes linéaires couplées en fournissant les premières garanties de complexité itérative dans les contextes déterministe et stochastique, tout en établissant un nouvel état de l'art pour les cas sans contraintes couplées.

Huiling Zhang, Zi Xu, Yuhong Dai2026-03-06🔢 math

Data Collaboration Analysis with Orthonormal Basis Selection and Alignment

Cet article présente l'Orthonormal Data Collaboration (ODC), une méthode qui améliore l'efficacité et la stabilité de la collaboration de données en imposant des bases orthonormées pour résoudre le problème d'alignement sous forme d'une solution fermée, réduisant ainsi considérablement la complexité computationnelle tout en garantissant des performances invariantes.

Keiyu Nosaka, Yamato Suetake, Yuichi Takano + 1 more2026-03-06🔢 math

Robust Control Lyapunov-Value Functions for Nonlinear Disturbed Systems

Cet article présente une extension des fonctions de valeur de Lyapunov de contrôle (CLVF) aux systèmes non linéaires perturbés via la définition de la CLVF robuste (R-CLVF), qui permet d'identifier l'ensemble invariant robuste minimal et de stabiliser le système avec un taux exponentiel spécifié, tout en proposant des techniques pour surmonter la malédiction de la dimensionnalité dans le calcul.

Zheng Gong, Sylvia Herbert2026-03-06🔢 math

Randomized Greedy Methods for Weak Submodular Sensor Selection with Robustness Considerations

Cet article propose des algorithmes de type « greedy » randomisés, à savoir MRG, DRG et Random-WSSA, pour résoudre efficacement des problèmes de sélection de capteurs sous contraintes de budget et de performance dans le cadre de fonctions faiblement sous-modulaires, tout en offrant des garanties d'approximation probabilistes et en démontrant leur efficacité pour les constellations de satellites d'observation de la Terre.

Ege C. Kaya, Michael Hibbard, Takashi Tanaka + 2 more2026-03-06🔢 math

Localized Distributional Robustness in Submodular Multi-Task Subset Selection

Cet article propose une nouvelle approche de sélection de sous-ensembles pour l'optimisation multi-tâches submodulaire, fondée sur la robustesse distributionnelle localisée via une régularisation par entropie relative, qui garantit à la fois une solution robuste et un calcul efficace grâce à des méthodes gloutonnes.

Ege C. Kaya, Abolfazl Hashemi2026-03-06🔢 math

Variational inequalities and smooth-fit principle for singular stochastic control problems in Hilbert spaces

Cet article établit que la fonction de valeur d'un problème de contrôle stochastique singulier en dimension infinie est une solution de viscosité $C^{1,\mathrm{Lip}}$ d'une inégalité variationnelle et vérifie un principe de raccord lisse d'ordre deux dans la direction contrôlée, en exploitant les liens avec les problèmes d'arrêt optimal et les propriétés d'analyse convexe.

Salvatore Federico, Giorgio Ferrari, Frank Riedel + 1 more2026-03-06🔢 math

Learning to Cover: Online Learning and Optimization with Irreversible Decisions

Cet article propose un algorithme asymptotiquement optimal pour un problème d'apprentissage en ligne avec décisions irréversibles visant à minimiser l'ouverture de sites sous une contrainte de couverture, démontrant que des politiques combinant une exploration initiale limitée et une exploitation rapide permettent d'atteindre un regret sous-linéaire qui converge exponentiellement vers sa limite à l'infini.

Alexandre Jacquillat, Michael Lingzhi Li2026-03-06🔢 math

Lyapunov Characterization for ISS of Impulsive Switched Systems

Cette étude établit des conditions nécessaires et suffisantes pour la stabilité entrée-état (ISS) des systèmes commutés impulsifs à modes stables et instables, en utilisant des fonctions de Lyapunov dépendantes du temps sous des contraintes de séjour et de départ moins restrictives, tout en proposant une méthode pour garantir l'ISS même lorsque le signal de commutation est inconnu.

Saeed Ahmed, Patrick Bachmann, Stephan Trenn2026-03-06🔢 math

Projected subgradient methods for paraconvex optimization: Application to robust low-rank matrix recovery

Cet article étudie les propriétés fondamentales des fonctions paraconvexes et analyse la convergence des méthodes de sous-gradient projeté pour leur optimisation, en validant théoriquement et numériquement leur efficacité sur divers problèmes de récupération de matrices de faible rang robustes.

Morteza Rahimi, Susan Ghaderi, Yves Moreau + 1 more2026-03-06🔢 math

← Précédent Suivant →

math.OC