Feed m Birds with One Scone: Accelerating Multi-task Gradient Balancing via Bi-level Optimization

El artículo presenta MARIGOLD, un marco algorítmico unificado que aborda la ineficiencia computacional de los métodos de balanceo de gradientes en el aprendizaje multitarea reformulando el problema como una optimización bi-nivel y resolviéndolo de manera eficiente mediante métodos de orden cero.

Xuxing Chen, Yun He, Jiayi Xu, Minhui Huang, Xiaoyi Liu, Boyang Liu, Fei Tian, Xiaohan Wei, Rong Jin, Sem Park, Bo Long, Xue FengTue, 10 Ma🤖 cs.LG

Constrained zero-sum LQ differential games for jump-diffusion systems with regime switching and random coefficients

Este artículo establece la solvabilidad en lazo abierto y proporciona una representación en lazo cerrado para el punto de silla en juegos diferenciales estocásticos lineales-cuadráticos con restricciones cónicas, coeficientes aleatorios, saltos y cambio de régimen, caracterizando la solución mediante ecuaciones de Riccati estocásticas extendidas multidimensionales indefinidas.

Yanyan Tang, Xu Li, Jie XiongTue, 10 Ma🔢 math

Cost-Driven Representation Learning for Linear Quadratic Gaussian Control: Part II

Este trabajo presenta garantías finitas de muestra para aprender representaciones de estado impulsadas por costos y controladores subóptimos en sistemas de control lineal cuadrático gaussiano (LQG) de horizonte infinito, abordando tanto modelos de dinámica latente explícitos como implícitos (similares a MuZero) y estableciendo una nueva contribución técnica sobre la excitación persistente en procesos estocásticos.

Yi Tian, Kaiqing Zhang, Russ Tedrake, Suvrit SraTue, 10 Ma🤖 cs.LG

IQC-Based Output-Feedback Control of LPV Systems with Time-Varying Input Delays

Este artículo presenta un método de control de retroalimentación de salida H\mathcal{H}_\infty para sistemas LPV con retardos de entrada variables en el tiempo, basado en el marco de restricciones cuadráticas integrales (IQC) y funciones de Lyapunov dependientes de parámetros, que permite condiciones de síntesis convexas y menos conservadoras mediante una estructura de controlador con memoria exacta.

Fen WuTue, 10 Ma🔢 math

Evaluating consumption effects of intelligent control algorithms for district heated buildings

Este artículo propone un enfoque basado en modelos para aislar y cuantificar exclusivamente los efectos de ahorro energético derivados de algoritmos de control inteligente en edificios con calefacción urbana, superando las limitaciones de los métodos tradicionales para separar dichas mejoras de otros cambios en el edificio, y valida su eficacia mediante datos reales de una década de la plataforma Danfoss Leanheat.

Antti Solonen, Arttu Häkkinen, Sallamaari Rapo, Antti Mäkinen, Sampo Kaukonen, Felipe UribeTue, 10 Ma🔢 math

Existence, Sharp Boundary Asymptotics, and Stochastic Optimal Control for Semilinear Elliptic Equations with Gradient-Dependent Terms and Singular Weights

Este artículo establece la existencia, unicidad y el comportamiento asintótico preciso en el borde de soluciones grandes para ecuaciones elípticas semilineales con términos dependientes del gradiente y pesos singulares, demostrando además la convexidad estricta de dichas soluciones y su identificación como funciones de valor en un problema de control estocástico óptimo.

Dragos-Patru CoveiTue, 10 Ma🔢 math

Compressed Proximal Federated Learning for Non-Convex Composite Optimization on Heterogeneous Data

El artículo presenta FedCEF, un algoritmo novedoso de aprendizaje federado que combina actualizaciones proximales desacopladas, mecanismos de retroalimentación de errores y estrategias de comunicación eficientes para lograr convergencia robusta y eficiente en la optimización compuesta no convexa sobre datos heterogéneos con compresión sesgada.

Pu Qiu, Chen Ouyang, Yongyang Xiong, Keyou You, Wanquan Liu, Yang ShiTue, 10 Ma🤖 cs.LG

Heterogeneous Stochastic Momentum ADMM for Distributed Nonconvex Composite Optimization

Este artículo presenta HSM-ADMM, un nuevo algoritmo de optimización distribuida no convexa que utiliza una estrategia de paso adaptativo específica por nodo y un estimador de momento recursivo para lograr una complejidad óptima y una convergencia acelerada en redes heterogéneas sin depender de parámetros globales ni requerir grandes tamaños de lote.

Yangming Zhang, Yongyang Xiong, Jinming Xu, Keyou You, Yang ShiTue, 10 Ma🔢 math

Large Language Model for Discrete Optimization Problems: Evaluation and Step-by-step Reasoning

Este trabajo evalúa las capacidades de diversos modelos de lenguaje grande, como Llama-3 y ChatGPT, en la resolución de problemas de optimización discreta mediante un conjunto de datos natural y ampliado, concluyendo que aunque los modelos más potentes rinden mejor, la técnica de razonamiento paso a paso (CoT) no siempre es efectiva y los datos desordenados pueden mejorar el rendimiento en problemas sencillos a pesar de la inestabilidad.

Tianhao Qian, Guilin Qi, Z. Y. Wu, Ran Gu, Xuanyi Liu, Canchen LyuTue, 10 Ma💬 cs.CL

Stabilization of monotone control systems with input constraints

El artículo presenta un controlador de retroalimentación de salida saturado que garantiza la estabilización de sistemas de control monótonos, tanto de dimensión finita como infinita, bajo restricciones de entrada, demostrando que si el sistema es estabilizable sin restricciones y el control de equilibrio deseado está en el interior del conjunto de restricciones, la versión saturada del controlador también logra la estabilización.

Till Preuster, Hannes Gernandt, Manuel SchallerTue, 10 Ma🔢 math

Continuous-Time Heterogeneous Agent Models with Recursive Utility and Preference for Late Resolution

Este artículo demuestra la existencia y unicidad de una solución de viscosidad restringida para la ecuación de Hamilton-Jacobi-Bellman en modelos de agentes heterogéneos continuos con utilidad recursiva y preferencia por la resolución tardía de la incertidumbre, estableciendo así la existencia de soluciones para el sistema de juegos de campo medio y analizando sus características cualitativas.

Yves Achdou, Qing TangTue, 10 Ma🔢 math

Robust Cooperative Output Regulation of Discrete-Time Heterogeneous Multi-Agent Systems

Este artículo aborda la regulación cooperativa robusta de sistemas multiagente heterogéneos discretos e inciertos mediante leyes de control distribuidas basadas en modelos internos, estableciendo condiciones suficientes globales y locales en forma de desigualdades matriciales lineales (LMI) para el diseño de ganancias de control estructuradas que aseguran la estabilidad del sistema.

Kursad Metehan Gul, Selahattin Burak SarsilmazTue, 10 Ma🔢 math

Transferable Optimization Network for Cross-Domain Image Reconstruction

Este artículo presenta un marco de aprendizaje transferible basado en optimización bi-nivel que combina un extractor de características universal entrenado con datos heterogéneos y un adaptador específico del dominio para lograr una reconstrucción de alta calidad de imágenes de resonancia magnética submuestreadas, incluso cuando se dispone de datos de entrenamiento limitados.

Yunmei Chen, Chi Ding, Xiaojing YeTue, 10 Ma🤖 cs.LG

Aero-Promptness: Drag-Aware Aerodynamic Manipulability for Propeller-driven Vehicles

Este trabajo presenta el Marco de Manipulabilidad Aerodinámica Consciente de la Resistencia (DAAM), una formulación geométrica que utiliza una métrica Riemanniana para resolver la redundancia en vehículos multirotor, optimizando la asignación de fuerzas generales mientras penaliza explícitamente la saturación por resistencia aerodinámica y las pérdidas de empuje a bajas revoluciones.

Antonio FranchiTue, 10 Ma🔢 math

Finite-Horizon Optimal Consumption and Investment with Time-Varying Job-Switching Costs

Este artículo estudia el problema de horizonte finito de un agente económico para determinar sus decisiones óptimas de consumo, inversión y cambio de empleo bajo costos variables en el tiempo, demostrando que el problema dual se reduce a un problema de doble obstáculo parabólico con obstáculos dependientes del tiempo y caracterizando las estrategias óptimas resultantes mediante la teoría de ecuaciones diferenciales parciales.

Gugyum Ha, Junkee Jeon, Jihoon OkTue, 10 Ma🔢 math