stat.ML articoli | Gist.Science

SurvHTE-Bench: A Benchmark for Heterogeneous Treatment Effect Estimation in Survival Analysis

Il paper introduce SurvHTE-Bench, il primo benchmark completo per la valutazione rigorosa e riproducibile dei metodi di stima degli effetti del trattamento eterogenei su dati di sopravvivenza censurati, basato su una suite diversificata di dataset sintetici, semi-sintetici e reali.

Shahriar Noroozizadeh, Xiaobin Shen, Jeremy C. Weiss + 1 more2026-03-06🤖 cs.AI

Sample-Optimal Locally Private Hypothesis Selection and the Provable Benefits of Interactivity

Questo lavoro presenta un algoritmo di selezione delle ipotesi localmente differenzialmente privato che, sfruttando un numero ridotto di round interattivi e il concetto di "query critiche", raggiunge una complessità di campionamento ottimale eliminando il fattore logaritmico necessario nelle soluzioni non interattive.

Alireza F. Pour, Hassan Ashtiani, Shahab Asoodeh2026-03-05🤖 cs.LG

List Sample Compression and Uniform Convergence

Questo articolo dimostra che, mentre la convergenza uniforme rimane equivalente all'apprendibilità nel contesto dell'apprendimento PAC con liste, la congettura sulla compressione del campione di Littlestone e Warmuth viene smentita, poiché esistono classi apprendibili con liste che non ammettono alcuna forma di compressione.

Steve Hanneke, Shay Moran, Tom Waknine2026-03-05🤖 cs.LG

Tracking solutions of time-varying variational inequalities

Questo lavoro estende le garanzie di tracciamento per le disuguaglianze variazionali temporali a funzioni non monotone e a percorsi non sublineari, analizzando inoltre il comportamento di convergenza o caotico di sistemi dinamici periodici e validando i risultati teorici attraverso esperimenti.

Hédi Hadiji, Sarah Sachs, Cristóbal Guzmán2026-03-05🤖 cs.LG

AuToMATo: An Out-Of-The-Box Persistence-Based Clustering Algorithm

Il paper presenta AuToMATo, un nuovo algoritmo di clustering basato sull'omologia persistente che, grazie a parametri predefiniti e a una procedura di bootstrap, offre prestazioni superiori rispetto ad altri metodi dello stato dell'arte ed è pienamente integrato nell'ecosistema scikit-learn per applicazioni come l'algoritmo Mapper.

Marius Huber, Sara Kalisnik, Patrick Schnider2026-03-05🤖 cs.LG

Low-Rank Contextual Reinforcement Learning from Heterogeneous Human Feedback

Il paper propone LoCo-RLHF, un framework che utilizza una struttura a basso rango e una politica pessimistica per allineare efficientemente i grandi modelli linguistici a feedback umani eterogenei e contestuali, garantendo robustezza agli spostamenti distribuzionali e prestazioni superiori.

Seong Jin Lee, Will Wei Sun, Yufeng Liu2026-03-05🤖 cs.LG

DCENWCNet: A Deep CNN Ensemble Network for White Blood Cell Classification with LIME-Based Explainability

Il paper propone DCENWCNet, un nuovo modello ensemble basato su tre architetture CNN con configurazioni uniche di dropout e max-pooling, che supera gli stati dell'arte nella classificazione dei globuli bianchi sul dataset Rabbin-WBC offrendo al contempo spiegazioni interpretabili tramite LIME per aumentare la fiducia nella diagnosi automatizzata.

Sibasish Dhibar2026-03-05🤖 cs.AI

Scalable physics-informed deep generative model for solving forward and inverse stochastic differential equations

Il presente studio propone il modello sPI-GeM, un approccio scalabile basato su reti generative profonde informate dalla fisica, in grado di risolvere con accuratezza equazioni differenziali stocastiche sia in avanti che inverse in spazi ad alta dimensionalità sia stocastica che spaziale.

Shaoqian Zhou, Wen You, Ling Guo + 1 more2026-03-05🔬 physics

Optimal Best-Arm Identification under Fixed Confidence with Multiple Optima

Questo lavoro introduce un nuovo limite inferiore teorico e un algoritmo modificato basato su Track-and-Stop che, sfruttando la conoscenza a priori del numero di bracci ottimali, raggiungono l'ottimalità asintotica nell'identificazione di un braccio migliore in contesti con più soluzioni ottimali.

Lan V. Truong2026-03-05🤖 cs.LG

Convergence, Sticking and Escape: Stochastic Dynamics Near Critical Points in SGD

Lo studio analizza le proprietà di convergenza e le dinamiche di fuga dello Stochastic Gradient Descent (SGD) in paesaggi unidimensionali, dimostrando come il rumore e la geometria della funzione influenzino i tempi di transizione tra i minimi locali e i massimi, evidenziando che l'algoritmo può rimanere intrappolato vicino a massimi locali ma tende a sfuggire da massimi "acuti" per raggiungere i minimi adiacenti.

Dmitry Dudukalov, Artem Logachov, Vladimir Lotov + 3 more2026-03-05🤖 cs.LG

A Copula Based Supervised Filter for Feature Selection in Diabetes Risk Prediction Using Machine Learning

Il paper propone un filtro supervisionato basato sulla copula di Gumbel per la selezione delle caratteristiche nella previsione del rischio di diabete, che identifica in modo efficiente i fattori di rischio estremi e dimostra prestazioni competitive rispetto ai metodi standard su dataset clinici e di salute pubblica.

Agnideep Aich, Md Monzur Murshed, Sameera Hewage + 1 more2026-03-05🤖 cs.LG

Boosting In-Context Learning in LLMs Through the Lens of Classical Supervised Learning

Il paper propone la Calibrazione Supervisionata (SC), un nuovo framework basato sulla minimizzazione della perdita che supera i limiti delle tecniche di calibrazione esistenti per l'Apprendimento in Contesto (ICL) nei LLM, permettendo di modificare l'orientamento dei confini decisionali e integrando regolarizzatori per migliorare la stabilità e le prestazioni su diversi modelli e dataset.

Korel Gundem, Juncheng Dong, Dennis Zhang + 2 more2026-03-05🤖 cs.AI

Honesty in Causal Forests: When It Helps and When It Hurts

Questo studio dimostra che l'uso automatico della stima onesta nei causal forests può ridurre l'accuratezza delle stime degli effetti causali individuali aumentando il rischio di sottostima, suggerendo che tale pratica dovrebbe essere valutata empiricamente in base agli obiettivi applicativi piuttosto che adottata come regola fissa.

Yanfang Hou, Carlos Fernández-Loría2026-03-05🤖 cs.LG

Federated ADMM from Bayesian Duality

Il lavoro propone un nuovo approccio bayesiano che generalizza il metodo federato ADMM sfruttando una struttura di dualità nelle ottimizzazioni variazionali, permettendo di recuperare le classiche aggiornamenti ADMM e di derivare nuove varianti, come quelle di tipo Newton e Adam, che migliorano significativamente l'accuratezza in scenari eterogenei.

Thomas Möllenhoff, Siddharth Swaroop, Finale Doshi-Velez + 1 more2026-03-05🤖 cs.LG

Finite-Dimensional Gaussian Approximation for Deep Neural Networks: Universality in Random Weights

Questo studio stabilisce limiti di approssimazione gaussiana per le distribuzioni finite-dimensionali di reti neurali profonde con pesi inizializzati casualmente, dimostrando la convergenza verso un limite gaussiano con tassi specifici quando le larghezze degli strati tendono all'infinito.

Krishnakumar Balasubramanian, Nathan Ross2026-03-05🤖 cs.LG

Best-of- $\infty$ -- Asymptotic Performance of Test-Time LLM Ensembling

Questo studio analizza le prestazioni asintotiche dell'ensembling di modelli linguistici tramite votazione a maggioranza al limite infinito, proponendo un metodo adattivo per ottimizzare il budget computazionale e un approccio di ensemble ponderato che supera le prestazioni dei singoli modelli.

Junpei Komiyama, Daisuke Oba, Masafumi Oyamada2026-03-05🤖 cs.AI

Learning in an Echo Chamber: Online Learning with Replay Adversary

Questo lavoro introduce un quadro teorico per l'apprendimento online in presenza di un avversario che ripropone errori passati, dimostrando che la dimensione di soglia estesa ( $\mathrm{ExThD}$ ) è la misura esatta della learnability e che l'apprendimento proprio è possibile solo per classi quasi intersezionate-chiuse, mentre algoritmi impropri possono comunque raggiungere limiti ottimali.

Daniil Dmitriev, Harald Eskelund Franck, Carolin Heinzler + 1 more2026-03-05🤖 cs.LG

Buzz, Choose, Forget: A Meta-Bandit Framework for Bee-Like Decision Making

Questo lavoro presenta MAYA, un modello di apprendimento sequenziale basato sui bandit multi-braccio che replica le decisioni di foraggiamento delle api, superando i metodi esistenti grazie alla sua capacità di modellare la memoria limitata e fornire traiettorie realistiche per applicazioni ecologiche.

Emmanuelle Claeys, Elena Kerjean, Jean-Michel Loubes2026-03-05🤖 cs.LG

Implicit Bias of Per-sample Adam on Separable Data: Departure from the Full-batch Regime

Questo lavoro dimostra che l'implicit bias dell'ottimizzatore Adam su dati separabili dipende criticamente dal regime di batch e dal dataset, potendo convergere verso un classificatore a margine massimo $\ell_2$ in modalità incrementale a differenza della tendenza $\ell_\infty$ del full-batch, mentre l'algoritmo Signum mantiene un bias invariato verso $\ell_\infty$ indipendentemente dalla dimensione del batch.

Beomhan Baek, Minhak Song, Chulhee Yun2026-03-05🤖 cs.AI

Implicit Bias of the JKO Scheme

Il documento caratterizza il bias implicito dello schema JKO al secondo ordine, dimostrando che esso equivale a un flusso di gradiente di Wasserstein su un'energia modificata che include un termine di decelerazione legato alla curvatura metrica, con implicazioni specifiche per funzioni come l'entropia e la divergenza KL.

Peter Halmos, Boris Hanin2026-03-05🤖 cs.AI

← Precedente Successivo →

stat.ML