stat.ML articoli | Gist.Science

A Diffusion Analysis of Policy Gradient for Stochastic Bandits

Questo studio analizza un'approssimazione di diffusione in tempo continuo per i gradienti di politica nei banditi stocastici, dimostrando che un tasso di apprendimento adeguato garantisce un rimpianto logaritmico, mentre un tasso troppo elevato porta a un rimpianto lineare in certi casi.

Tor LattimoreThu, 12 Ma📊 stat

A Trust-Region Interior-Point Stochastic Sequential Quadratic Programming Method

Questo articolo propone un metodo di programmazione quadratica sequenziale stocastica con regione di fiducia e punto interno (TR-IP-SSQP) per ottimizzare funzioni obiettivo stocastiche soggette a vincoli non lineari deterministici, dimostrandone la convergenza quasi certa e le prestazioni pratiche su problemi di classificazione e di ottimizzazione.

Yuchen Fang, Jihun Kim, Sen Na, James Demmel, Javad LavaeiThu, 12 Ma🔢 math

Bayesian Hierarchical Models and the Maximum Entropy Principle

Il documento dimostra che, quando la prior condizionata agli iperparametri è una distribuzione canonica di massima entropia, anche la prior marginale risultante nei modelli gerarchici bayesiani conserva una proprietà di massima entropia, ma vincolata alla distribuzione marginale di una funzione delle quantità incognite, rivelando così la natura delle informazioni assunte in tali modelli.

Brendon J. BrewerThu, 12 Ma📊 stat

MultiwayPAM: Multiway Partitioning Around Medoids for LLM-as-a-Judge Score Analysis

Il paper propone MultiwayPAM, un nuovo metodo di clustering tensoriale che analizza i punteggi ottenuti tramite LLM-as-a-Judge per ridurre i costi computazionali e identificare i bias intrinseci degli evaluator, permettendo di scoprire la struttura di appartenenza di domande, rispondenti e valutatori attraverso l'individuazione simultanea dei membri e dei medoidi di ciascun cluster.

Chihiro Watanabe, Jingyu SunThu, 12 Ma📊 stat

On The Complexity of Best-Arm Identification in Non-Stationary Linear Bandits

Questo lavoro risolve il problema di identificazione del braccio migliore in banditi lineari non stazionari stabilendo un limite inferiore dipendente dall'insieme dei bracci e proponendo l'algoritmo $\textsf{Adjacent-BAI}$ basato sul design ottimale adiacente, che raggiunge tale limite e supera le stime pessimistiche basate sul design G-ottimale.

Leo Maynard-Zhang, Zhihan Xiong, Kevin Jamieson, Maryam FazelThu, 12 Ma📊 stat

Designing Service Systems from Textual Evidence

Questo articolo presenta PP-LUCB, un algoritmo che ottimizza la progettazione dei sistemi di servizio identificando la configurazione migliore con alta confidenza e riducendo i costi di audit umano, combinando valutazioni economiche ma distorte di modelli linguistici con verifiche mirate basate su prove testuali.

Ruicheng Ao, Hongyu Chen, Siyang Gao, Hanwei Li, David Simchi-LeviThu, 12 Ma🤖 cs.LG

Adaptive Active Learning for Regression via Reinforcement Learning

Il paper propone WiGS, un metodo di apprendimento attivo per la regressione che utilizza l'apprendimento per rinforzo per adattare dinamicamente il criterio di selezione dei campioni, superando le limitazioni dei metodi statici e migliorando l'efficienza e l'accuratezza su dataset con densità irregolare.

Simon D. Nguyen, Troy Russo, Kentaro Hoffman, Tyler H. McCormickThu, 12 Ma📊 stat

GGMPs: Generalized Gaussian Mixture Processes

Il paper introduce i Generalized Gaussian Mixture Processes (GGMP), un metodo basato sui Gaussian Process che combina l'adattamento locale di miscele gaussiane e l'allineamento dei componenti per stimare densità condizionali multimodali ed eteroschedastiche in modo efficiente e scalabile.

Vardaan Tekriwal, Mark D. Risser, Hengrui Luo, Marcus M. NoackThu, 12 Ma🤖 cs.LG

Brenier Isotonic Regression

Il paper propone la "regressione isotonica di Brenier", un nuovo metodo di regressione multi-output che estende la regressione isotonica classica sfruttando il trasporto ottimo di Kantorovich per garantire la monotonia ciclica, dimostrando prestazioni superiori nella calibrazione delle probabilità e nei modelli lineari generalizzati.

Han Bao, Amirreza Eshraghi, Yutong WangThu, 12 Ma📊 stat

Dual Space Preconditioning for Gradient Descent in the Overparameterized Regime

Questo lavoro dimostra che la Discesa del Gradiente Precondizionata nello Spazio Duale converge a una soluzione che interpola i dati nel regime sovraparametrizzato e, nel caso di precondizionatori isotropi, minimizza la distanza di Frobenius rispetto all'inizializzazione, condividendo così lo stesso bias implicito della discesa del gradiente standard.

Reza Ghane, Danil Akhtiamov, Babak HassibiThu, 12 Ma📊 stat

Beyond Accuracy: Reliability and Uncertainty Estimation in Convolutional Neural Networks

Questo studio confronta l'approssimazione bayesiana tramite Monte Carlo Dropout e il framework di Conformal Prediction su due architetture CNN addestrate su Fashion-MNIST, evidenziando come GoogLeNet offra stime di incertezza meglio calibrate rispetto a H-CNN VGG16 e come il Conformal Prediction garantisca validità statistica cruciale per decisioni ad alto rischio.

Sanne Ruijs, Alina Kosiakova, Farrukh JavedThu, 12 Ma📊 stat

ReTabSyn: Realistic Tabular Data Synthesis via Reinforcement Learning

Il paper presenta ReTabSyn, un metodo di sintesi tabulare basato sul reinforcement learning che, focalizzandosi sulla distribuzione condizionale $P(y\mid \bm{X})$ anziché su quella congiunta completa, migliora l'efficienza dei dati e le prestazioni dei modelli predittivi in scenari con campioni limitati e squilibrio delle classi.

Xiaofeng Lin, Seungbae Kim, Zhuoya Li, Zachary DeSoto, Charles Fleming, Guang ChengThu, 12 Ma📊 stat

Kernel Tests of Equivalence

Il paper propone nuovi test basati su kernel, utilizzando la discrepanza di Stein e la discrepanza massima media, per valutare l'equivalenza tra distribuzioni e superare i limiti dei test di bontà di adattamento tradizionali che non possono confermare l'assenza di differenze significative.

Xing Liu, Axel GandyThu, 12 Ma📊 stat

When should we trust the annotation? Selective prediction for molecular structure retrieval from mass spectra

Questo articolo introduce un framework di previsione selettiva per il recupero di strutture molecolari dagli spettri di massa, dimostrando che l'uso di misure di incertezza a livello di recupero e di controllo del rischio senza distribuzione permette di ottenere annotazioni affidabili con un tasso di errore controllato, evitando così previsioni in contesti ad alto rischio.

Mira Jürgens, Gaetan De Waele, Morteza Rakhshaninejad, Willem WaegemanThu, 12 Ma📊 stat

Bayesian Optimization with Gaussian Processes to Accelerate Stationary Point Searches

Questo articolo presenta un quadro unificato di ottimizzazione bayesiana basato su processi gaussiani che, attraverso un ciclo di surrogate a sei passaggi e tecniche avanzate come l'ottimizzazione del trasporto e le caratteristiche di Fourier casuali, accelera l'identificazione di punti stazionari su superfici di energia potenziale riducendo drasticamente il numero di valutazioni necessarie.

Rohit Goswami (Institute IMX and Lab-COSMO, École polytechnique fédérale de Lausanne)Thu, 12 Ma📊 stat

Expert-Aided Causal Discovery of Ancestral Graphs

Il paper presenta AGFN, un algoritmo di apprendimento per rinforzo che integra conoscenze esperte a priori e feedback incerti a posteriori per inferire distribuzioni su grafi ancestrali, migliorando l'affidabilità della scoperta causale in presenza di confondimento latente.

Tiago da Silva, Bruna Bazaluk, Eliezer de Souza da Silva, António Góis, Salem Lahlou, Dominik Heider, Samuel Kaski, Diego Mesquita, Adèle Helena RibeiroMon, 09 Ma🤖 cs.LG

Predictive Coding Networks and Inference Learning: Tutorial and Survey

Questo lavoro offre una revisione completa e una specifica formale dettagliata delle reti di codifica predittiva, presentandole come un quadro neurale ispirato e biologicamente plausibile che supera i limiti della retropropagazione tradizionale e si posiziona come una soluzione promettente per l'innovazione futura nel machine learning.

Björn van Zwol, Ro Jefferson, Egon L. van den BroekMon, 09 Ma🤖 cs.AI

Theoretical Foundations of Conformal Prediction

Questo libro fornisce una trattazione pedagogica e unificata delle basi teoriche della previsione conforme e delle tecniche inferenziali correlate, presentando le dimostrazioni dei risultati più importanti della letteratura per offrire garanzie finite e senza assunzioni distributive nell'ambito dell'apprendimento automatico.

Anastasios N. Angelopoulos, Rina Foygel Barber, Stephen BatesMon, 09 Ma🔢 math

L0-Regularized Quadratic Surface Support Vector Machines

Questo lavoro propone varianti sparse delle macchine a vettori di supporto quadratiche (QSVM) basate sulla regolarizzazione $\ell_0$ per migliorare l'interpretabilità e la generalizzazione, sviluppando un algoritmo di decomposizione della penalità che garantisce condizioni di ottimalità e dimostrando l'efficacia del metodo attraverso esperimenti numerici su dataset pubblici e reali.

Ahmad Mousavi, Ramin Zandvakili, Zheming GaoMon, 09 Ma🤖 cs.LG

Entropic Mirror Descent for Linear Systems: Polyak's Stepsize and Implicit Bias

Questo articolo introduce una variante del passo di Polyak per l'uso della discesa dello specchio entropica nella risoluzione di sistemi lineari, superando le sfide legate al dominio illimitato e ottenendo risultati di convergenza sublineare e lineare, oltre a rafforzare i limiti sul bias implicito nella norma $\ell_1$ e generalizzare i risultati a funzioni convesse lisce arbitrarie.

Yura Malitsky, Alexander PoschMon, 09 Ma🤖 cs.LG

← Precedente Successivo →