Feed m Birds with One Scone: Accelerating Multi-task Gradient Balancing via Bi-level Optimization

Ce papier présente MARIGOLD, un cadre algorithmique unifié qui accélère l'équilibrage des gradients en apprentissage multi-tâches en modélisant le problème comme une optimisation bi-niveau résolue efficacement par une méthode d'ordre zéro, surmontant ainsi les limitations de coût computationnel des méthodes existantes comme MGDA.

Xuxing Chen, Yun He, Jiayi Xu, Minhui Huang, Xiaoyi Liu, Boyang Liu, Fei Tian, Xiaohan Wei, Rong Jin, Sem Park, Bo Long, Xue FengTue, 10 Ma🤖 cs.LG

Constrained zero-sum LQ differential games for jump-diffusion systems with regime switching and random coefficients

Cet article établit la résolubilité en boucle ouverte et fournit une représentation en boucle fermée du point de selle pour un jeu différentiel linéaire-quadratique stochastique à somme nulle avec contraintes coniques, sauts et coefficients aléatoires, en dérivant de nouvelles équations de Riccati stochastiques étendues multidimensionnelles indéfinies.

Yanyan Tang, Xu Li, Jie XiongTue, 10 Ma🔢 math

IQC-Based Output-Feedback Control of LPV Systems with Time-Varying Input Delays

Cet article propose une méthode de commande par retour de sortie H\mathcal{H}_\infty pour les systèmes LPV à retards d'entrée variables, fondée sur le cadre des contraintes quadratiques intégrales (IQC) et des fonctions de Lyapunov dépendantes des paramètres, qui permet d'obtenir des conditions de synthèse convexes et moins conservatrices grâce à une structure de contrôleur à mémoire exacte.

Fen WuTue, 10 Ma🔢 math

Evaluating consumption effects of intelligent control algorithms for district heated buildings

Cet article propose une approche basée sur des modèles pour isoler et décomposer les effets de consommation énergétique spécifiques aux algorithmes de contrôle intelligent dans les bâtiments chauffés par réseau, en utilisant des données réelles sur dix ans pour surmonter les limites des méthodes de suivi traditionnelles.

Antti Solonen, Arttu Häkkinen, Sallamaari Rapo, Antti Mäkinen, Sampo Kaukonen, Felipe UribeTue, 10 Ma🔢 math

Existence, Sharp Boundary Asymptotics, and Stochastic Optimal Control for Semilinear Elliptic Equations with Gradient-Dependent Terms and Singular Weights

Cet article établit l'existence, l'unicité et le comportement asymptotique précis à la frontière des solutions explosives d'une équation elliptique semi-linéaire avec des termes dépendant du gradient et des poids singuliers, tout en démontrant la convexité stricte de ces solutions et en les identifiant comme des fonctions de valeur d'un problème de contrôle stochastique optimal.

Dragos-Patru CoveiTue, 10 Ma🔢 math

Compressed Proximal Federated Learning for Non-Convex Composite Optimization on Heterogeneous Data

Cet article propose FedCEF, un nouvel algorithme de fédéré pour l'optimisation composite non convexe qui combine une mise à jour proximale découplée, un mécanisme de rétroaction d'erreur et une stratégie de reconstruction descendante pour garantir une convergence robuste et une efficacité communicationnelle élevée, même avec des données hétérogènes et une compression agressive.

Pu Qiu, Chen Ouyang, Yongyang Xiong, Keyou You, Wanquan Liu, Yang ShiTue, 10 Ma🤖 cs.LG

Heterogeneous Stochastic Momentum ADMM for Distributed Nonconvex Composite Optimization

Cet article propose l'algorithme HSM-ADMM, une méthode stochastique distribuée pour l'optimisation composite non convexe qui utilise une stratégie de pas adaptatif spécifique à chaque nœud et un estimateur de momentum pour atteindre une complexité optimale de O(ϵ1.5)\mathcal{O}(\epsilon^{-1.5}) tout en découplant la stabilité des propriétés globales du réseau et en réduisant la bande passante de communication.

Yangming Zhang, Yongyang Xiong, Jinming Xu, Keyou You, Yang ShiTue, 10 Ma🔢 math

Large Language Model for Discrete Optimization Problems: Evaluation and Step-by-step Reasoning

Cette étude évalue les capacités de différents grands modèles de langage, notamment la série Llama-3 et ChatGPT, à résoudre des problèmes d'optimisation discrète à grande échelle via des jeux de données variés, révélant que si les modèles plus puissants obtiennent de meilleurs résultats, la technique de raisonnement par étapes (CoT) n'est pas systématiquement efficace et que des données désordonnées peuvent paradoxalement améliorer les performances sur des problèmes simples malgré une instabilité accrue.

Tianhao Qian, Guilin Qi, Z. Y. Wu, Ran Gu, Xuanyi Liu, Canchen LyuTue, 10 Ma💬 cs.CL

Weak Scalability of time parallel Schwarz methods for parabolic optimal control problems

Cet article présente une analyse théorique et numérique démontrant la faible évolutivité de la méthode de Schwarz parallèle en temps pour les problèmes de contrôle optimal paraboliques, en établissant de nouvelles bornes de convergence et en validant leur efficacité pour les simulations à grande échelle sur des architectures de calcul haute performance.

Liu-Di Lu, Tommaso VanzanTue, 10 Ma🔢 math

Continuous-Time Heterogeneous Agent Models with Recursive Utility and Preference for Late Resolution

Cet article établit l'existence et l'unicité d'une solution de viscosité contrainte pour l'équation de Hamilton-Jacobi-Bellman dans le cadre de modèles d'agents hétérogènes en temps continu avec utilité récursive et préférence pour la résolution tardive de l'incertitude, tout en démontrant l'existence de solutions au système d'jeux à champ moyen et en discutant de leurs caractéristiques qualitatives.

Yves Achdou, Qing TangTue, 10 Ma🔢 math

Transferable Optimization Network for Cross-Domain Image Reconstruction

Les auteurs proposent un cadre novateur d'apprentissage par transfert basé sur une optimisation bi-niveau, combinant un extracteur de caractéristiques universel et un adaptateur spécifique à la tâche, pour réaliser une reconstruction d'images de haute qualité, notamment en IRM sous-échantillonnée, malgré un manque de données d'entraînement en exploitant des sources hétérogènes et multi-domaines.

Yunmei Chen, Chi Ding, Xiaojing YeTue, 10 Ma🤖 cs.LG

Aero-Promptness: Drag-Aware Aerodynamic Manipulability for Propeller-driven Vehicles

Cet article présente le cadre géométrique de la Manipulabilité Aérodynamique Sensible à la Traînée (DAAM), qui intègre les limites de couple moteur et la traînée aérodynamique pour optimiser l'allocation de contrôle dans les multirotors redondants tout en garantissant l'invariance aux échelles de coordonnées et en caractérisant mathématiquement les discontinuités globales induites par les limites physiques des actionneurs.

Antonio FranchiTue, 10 Ma🔢 math