A Trust-Region Interior-Point Stochastic Sequential Quadratic Programming Method

Questo articolo propone un metodo di programmazione quadratica sequenziale stocastica con regione di fiducia e punto interno (TR-IP-SSQP) per ottimizzare funzioni obiettivo stocastiche soggette a vincoli non lineari deterministici, dimostrandone la convergenza quasi certa e le prestazioni pratiche su problemi di classificazione e di ottimizzazione.

Yuchen Fang, Jihun Kim, Sen Na, James Demmel, Javad LavaeiThu, 12 Ma🔢 math

MultiwayPAM: Multiway Partitioning Around Medoids for LLM-as-a-Judge Score Analysis

Il paper propone MultiwayPAM, un nuovo metodo di clustering tensoriale che analizza i punteggi ottenuti tramite LLM-as-a-Judge per ridurre i costi computazionali e identificare i bias intrinseci degli evaluator, permettendo di scoprire la struttura di appartenenza di domande, rispondenti e valutatori attraverso l'individuazione simultanea dei membri e dei medoidi di ciascun cluster.

Chihiro Watanabe, Jingyu SunThu, 12 Ma📊 stat

On The Complexity of Best-Arm Identification in Non-Stationary Linear Bandits

Questo lavoro risolve il problema di identificazione del braccio migliore in banditi lineari non stazionari stabilendo un limite inferiore dipendente dall'insieme dei bracci e proponendo l'algoritmo Adjacent-BAI\textsf{Adjacent-BAI} basato sul design ottimale adiacente, che raggiunge tale limite e supera le stime pessimistiche basate sul design G-ottimale.

Leo Maynard-Zhang, Zhihan Xiong, Kevin Jamieson, Maryam FazelThu, 12 Ma📊 stat

Beyond Accuracy: Reliability and Uncertainty Estimation in Convolutional Neural Networks

Questo studio confronta l'approssimazione bayesiana tramite Monte Carlo Dropout e il framework di Conformal Prediction su due architetture CNN addestrate su Fashion-MNIST, evidenziando come GoogLeNet offra stime di incertezza meglio calibrate rispetto a H-CNN VGG16 e come il Conformal Prediction garantisca validità statistica cruciale per decisioni ad alto rischio.

Sanne Ruijs, Alina Kosiakova, Farrukh JavedThu, 12 Ma📊 stat

ReTabSyn: Realistic Tabular Data Synthesis via Reinforcement Learning

Il paper presenta ReTabSyn, un metodo di sintesi tabulare basato sul reinforcement learning che, focalizzandosi sulla distribuzione condizionale P(yX)P(y\mid \bm{X}) anziché su quella congiunta completa, migliora l'efficienza dei dati e le prestazioni dei modelli predittivi in scenari con campioni limitati e squilibrio delle classi.

Xiaofeng Lin, Seungbae Kim, Zhuoya Li, Zachary DeSoto, Charles Fleming, Guang ChengThu, 12 Ma📊 stat

When should we trust the annotation? Selective prediction for molecular structure retrieval from mass spectra

Questo articolo introduce un framework di previsione selettiva per il recupero di strutture molecolari dagli spettri di massa, dimostrando che l'uso di misure di incertezza a livello di recupero e di controllo del rischio senza distribuzione permette di ottenere annotazioni affidabili con un tasso di errore controllato, evitando così previsioni in contesti ad alto rischio.

Mira Jürgens, Gaetan De Waele, Morteza Rakhshaninejad, Willem WaegemanThu, 12 Ma📊 stat

Bayesian Optimization with Gaussian Processes to Accelerate Stationary Point Searches

Questo articolo presenta un quadro unificato di ottimizzazione bayesiana basato su processi gaussiani che, attraverso un ciclo di surrogate a sei passaggi e tecniche avanzate come l'ottimizzazione del trasporto e le caratteristiche di Fourier casuali, accelera l'identificazione di punti stazionari su superfici di energia potenziale riducendo drasticamente il numero di valutazioni necessarie.

Rohit Goswami (Institute IMX and Lab-COSMO, École polytechnique fédérale de Lausanne)Thu, 12 Ma📊 stat

L0-Regularized Quadratic Surface Support Vector Machines

Questo lavoro propone varianti sparse delle macchine a vettori di supporto quadratiche (QSVM) basate sulla regolarizzazione 0\ell_0 per migliorare l'interpretabilità e la generalizzazione, sviluppando un algoritmo di decomposizione della penalità che garantisce condizioni di ottimalità e dimostrando l'efficacia del metodo attraverso esperimenti numerici su dataset pubblici e reali.

Ahmad Mousavi, Ramin Zandvakili, Zheming GaoMon, 09 Ma🤖 cs.LG

Entropic Mirror Descent for Linear Systems: Polyak's Stepsize and Implicit Bias

Questo articolo introduce una variante del passo di Polyak per l'uso della discesa dello specchio entropica nella risoluzione di sistemi lineari, superando le sfide legate al dominio illimitato e ottenendo risultati di convergenza sublineare e lineare, oltre a rafforzare i limiti sul bias implicito nella norma 1\ell_1 e generalizzare i risultati a funzioni convesse lisce arbitrarie.

Yura Malitsky, Alexander PoschMon, 09 Ma🤖 cs.LG