Zero-Shot Transferable Solution Method for Parametric Optimal Control Problems

Questo articolo presenta un metodo di soluzione trasferibile a zero-shot per problemi di controllo ottimo parametrici, basato su politiche con codificatori di funzioni che apprendono un insieme riutilizzabile di funzioni di base neurali per abilitare un adattamento efficiente e quasi ottimale a nuovi obiettivi senza necessità di ricalcolo.

Xingjian Li, Kelvin Kan, Deepanshu Verma, Krishna Kumar, Stanley Osher, Ján DrgonaThu, 12 Ma🤖 cs.LG

A Trust-Region Interior-Point Stochastic Sequential Quadratic Programming Method

Questo articolo propone un metodo di programmazione quadratica sequenziale stocastica con regione di fiducia e punto interno (TR-IP-SSQP) per ottimizzare funzioni obiettivo stocastiche soggette a vincoli non lineari deterministici, dimostrandone la convergenza quasi certa e le prestazioni pratiche su problemi di classificazione e di ottimizzazione.

Yuchen Fang, Jihun Kim, Sen Na, James Demmel, Javad LavaeiThu, 12 Ma🔢 math

Optimal Control Synthesis of Closed-Loop Recommendation Systems over Social Networks

Questo articolo propone una sintesi di controllo ottimo per sistemi di raccomandazione su reti sociali, modellandoli come problemi di controllo a retroazione di stato che bilanciano coinvolgimento e stabilità, dimostrando come la scelta appropriata dei pesi garantisca la stabilità del sistema mentre pesi eccessivamente orientati all'engagement possano portare a comportamenti patologici e destabilizzanti.

Simone Mariano, Paolo FrascaThu, 12 Ma⚡ eess

Equilibrium under Time-Inconsistency: A New Existence Theory by Vanishing Entropy Regularization

Questo articolo risolve il problema dell'esistenza di equilibri in problemi di controllo stocastico a tempo-incoerente dimostrando che la regolarizzazione entropica delle politiche rilassate garantisce l'esistenza di soluzioni classiche per un'equazione HJB esplorativa, le quali convergono a una soluzione debole dell'equazione originale quando la regolarizzazione svanisce, fornendo così una nuova condizione sufficiente senza richiedere forti ipotesi di regolarità.

Zhenhua Wang, Xiang Yu, Jingjie Zhang, Zhou ZhouThu, 12 Ma🔢 math

Linear complementarity properties of some classes of banded matrices

Questo articolo esamina le proprietà di complementarità lineare di matrici a bande, caratterizzando la proprietà Q per matrici triangolari e bidiagonali sud-ovest tramite i loro pattern di segno e determinanti, estendendo poi i risultati alle algebre di Jordan euclidee per dimostrare che una trasformazione lineare di rango uno possiede tale proprietà se e solo se i vettori coinvolti hanno lo stesso segno.

Samapti Pratihar, M. Seetharama Gowda, K. C. SivakumarThu, 12 Ma🔢 math

A Globally Convergent Flow for Time-Dependent Mean Field Games and a Solver-Agnostic Framework for Inverse Problems

Questo lavoro propone un flusso di Hessian-Riemanniano monotono per garantire la convergenza globale nella risoluzione diretta dei giochi di campo medio dipendenti dal tempo e introduce un framework agnostico rispetto al solver per i problemi inversi, che disaccoppia l'ottimizzazione dei parametri dalla soluzione diretta mediante differenziazione implicita.

Hanwei Yan, Xianjin Yang, Jingguo ZhangThu, 12 Ma🔢 math