stat.ML articoli | Gist.Science

Improved Scaling Laws via Weak-to-Strong Generalization in Random Feature Ridge Regression

Questo articolo dimostra che, nell'ambito della regressione ridge a caratteristiche casuali, un modello "forte" addestrato su etichette imperfette generate da un modello "debole" può superare significativamente le leggi di scala del proprio insegnante, raggiungendo persino il tasso ottimale minimax indipendentemente dalle prestazioni del teacher.

Diyuan Wu, Lehan Chen, Theodor Misiakiewicz, Marco Mondelli2026-03-09🤖 cs.LG

Design Experiments to Compare Multi-armed Bandit Algorithms

Il paper propone "Artificial Replay", un nuovo disegno sperimentale che permette di confrontare algoritmi a bandito multi-braccio riutilizzando le traiettorie registrate per ridurre drasticamente i costi di interazione e la varianza dell' stimatore rispetto ai metodi tradizionali.

Huiling Meng, Ningyuan Chen, Xuefeng Gao2026-03-09🤖 cs.LG

Large deviation principles for convolutional Bayesian neural networks

Questo lavoro stabilisce il primo principio di grandi deviazioni per le reti neurali convoluzionali nel regime a canali infiniti, fornendo risultati rigorosi sulle matrici di covarianza condizionale e sulla distribuzione a posteriori, oltre a offrire una dimostrazione semplificata della loro convergenza verso processi gaussiani.

Federico Bassetti, Vassili De Palma, Lucia Ladelli2026-03-09🔢 math

Agnostic learning in (almost) optimal time via Gaussian surface area

Questo lavoro migliora i limiti superiori noti per l'apprendimento agnostico di classi di concetti rispetto alla misura gaussiana, dimostrando che un'approssimazione polinomiale di grado $\tilde O(\Gamma^2 / \varepsilon^2)$ è sufficiente per ottenere una precisione $\varepsilon$ , ottenendo così limiti (quasi) ottimali per l'apprendimento di funzioni soglia polinomiali nel modello delle query statistiche.

Lucas Pesenti, Lucas Slot, Manuel Wiedmer2026-03-09🤖 cs.LG

Predictive Coding Graphs are a Superset of Feedforward Neural Networks

Il documento dimostra che i grafi di codifica predittiva costituiscono un insieme matematico sovrastante delle reti neurali feedforward, rafforzando così il loro ruolo nel machine learning moderno e la rilevanza della topologia nelle reti neurali.

Björn van Zwol2026-03-09🤖 cs.AI

Gradient Flow Polarizes Softmax Outputs towards Low-Entropy Solutions

Il paper dimostra che il flusso gradiente nei modelli softmax basati su valori spinge intrinsecamente l'ottimizzazione verso soluzioni a bassa entropia, fornendo una spiegazione teorica per fenomeni empirici come i "attention sinks" e le massive activations nei transformer.

Aditya Varre, Mark Rofin, Nicolas Flammarion2026-03-09🤖 cs.LG

SPPCSO: Adaptive Penalized Estimation Method for High-Dimensional Correlated Data

Il documento presenta SPPCSO, un innovativo metodo di stima penalizzata che integra la regressione su componenti principali e la regolarizzazione $L_1$ per garantire stabilità e selezione coerente delle variabili in dati ad alta dimensionalità e fortemente correlati, dimostrando efficacia sia in simulazioni numeriche che nell'analisi di dati di espressione genica.

Ying Hu, Hu Yang2026-03-09🤖 cs.LG

Synthetic Monitoring Environments for Reinforcement Learning

Il documento presenta gli Ambienti di Monitoraggio Sintetici (SME), una suite infinita di compiti di controllo continuo con politiche ottimali note, progettata per fornire diagnosi precise e trasparenti delle prestazioni degli agenti di Reinforcement Learning attraverso la valutazione sistematica sia in-distribution che out-of-distribution.

Leonard Pleiss, Carolin Schmidt, Maximilian Schiffer2026-03-09🤖 cs.LG

Robust support vector model based on bounded asymmetric elastic net loss for binary classification

Questo articolo propone il BAEN-SVM, un nuovo modello di classificazione binaria basato su una funzione di perdita elastica netta asimmetrica limitata che garantisce robustezza al rumore, consistenza teorica e prestazioni superiori rispetto alle SVM tradizionali, risolvendo il problema di ottimizzazione non convessa tramite un algoritmo specifico.

Haiyan Du, Hu Yang2026-03-09🤖 cs.LG

Certified and accurate computation of function space norms of deep neural networks

Questo lavoro presenta un framework per il calcolo certificato e accurato delle norme negli spazi funzionali (come Lebesgue e Sobolev) delle reti neurali profonde, combinando l'aritmetica intervallare, la raffinamento adattivo e l'aggregazione basata su quadratura per ottenere limiti deterministici garantiti sugli integrali delle funzioni e delle loro derivate, superando i limiti delle valutazioni puntuali.

Johannes Gründler, Moritz Maibaum, Philipp Petersen2026-03-09🤖 cs.LG

Bayesian Additive Distribution Regression

Il paper presenta DistBART, un approccio bayesiano non parametrico per la regressione distribuzionale che utilizza ensemble di alberi decisionali per modellare funzionali lineari, offrendo sia risultati teorici sulla concentrazione che una scalabilità computazionale tramite approssimazione a caratteristiche casuali.

Antonio R. Linero, Soumyabrata Bose, Jared Murray2026-03-09📊 stat

Semantics-Aware Caching for Concept Learning

Il paper presenta un approccio di caching consapevole della semantica che riduce il tempo di esecuzione dell'apprendimento dei concetti di un ordine di grandezza, migliorando l'efficienza sia per i ragionatori simbolici che per quelli neuro-simbolici.

Louis Mozart Kamdem Teyou, Caglar Demir, Axel-Cyrille Ngonga Ngomo2026-03-09🤖 cs.LG

Zeroth-Order primal-dual Alternating Projection Gradient Algorithms for Nonconvex Minimax Problems with Coupled linear Constraints

Questo articolo propone due algoritmi di discesa del gradiente alternato proiettato di ordine zero, denominati ZO-PDAPG e ZO-RMPDPG, che risolvono problemi minimax non convessi con vincoli lineari accoppiati in contesti deterministici e stocastici, garantendo complessità iterativa e stabilendo un nuovo stato dell'arte per la classe non convessa-concava.

Huiling Zhang, Zi Xu, Yuhong Dai2026-03-06🔢 math

Towards a Fairer Non-negative Matrix Factorization

Questo lavoro propone un approccio di fattorizzazione di matrice non negativa (NMF) equo basato su una formulazione min-max, presentando algoritmi di ottimizzazione e dimostrando attraverso esperimenti che tale metodo può migliorare l'equità tra i gruppi, sebbene a volte a scapito dell'accuratezza individuale e richiedendo una scelta metodologica adattata al contesto applicativo.

Lara Kassab, Erin George, Deanna Needell + 3 more2026-03-06💻 cs

An Experimental Study on Fairness-aware Machine Learning for Credit Scoring Problems

Questo studio sperimentale dimostra che i modelli di machine learning consapevoli dell'equità offrono un miglior compromesso tra accuratezza predittiva e imparzialità rispetto ai modelli tradizionali nell'ambito della valutazione del credito.

Huyen Giang Thi Thu, Thang Viet Doan, Ha-Bang Ban + 1 more2026-03-06💻 cs

Curse of Dimensionality in Neural Network Optimization

Questo articolo dimostra l'esistenza della maledizione della dimensionalità nell'ottimizzazione delle reti neurali, stabilendo che il rischio di popolazione non può decadere più velocemente di un tasso specifico dipendente dalla dimensionalità e dalla regolarità della funzione target, sia nel caso di funzioni di attivazione Lipschitziane che di quelle localmente Lipschitziane.

Sanghoon Na, Haizhao Yang2026-03-06🔢 math

Generalization Bounds for Markov Algorithms through Entropy Flow Computations

Questo lavoro estende il metodo del flusso di entropia, precedentemente limitato a specifiche dinamiche stocastiche, a tutti gli algoritmi di apprendimento governati da processi di Markov omogenei nel tempo, stabilendo nuovi legami tra l'errore di generalizzazione e le proprietà ergodiche attraverso una formula esatta e disuguaglianze di Sobolev logaritmiche modificate.

Benjamin Dupuis, Maxime Haddouche, George Deligiannidis + 1 more2026-03-06💻 cs

Double Momentum and Error Feedback for Clipping with Fast Rates and Differential Privacy

Il paper propone e analizza Clip21-SGD2M, un nuovo metodo per l'apprendimento federato che combina clipping, momentum e feedback dell'errore per garantire simultaneamente ottimali tassi di convergenza e privacy differenziale anche in presenza di dati eterogenei e non convessi.

Rustem Islamov, Samuel Horvath, Aurelien Lucchi + 2 more2026-03-06🔢 math

Variational Formulation of Particle Flow

Questo articolo presenta una formulazione variazionale del flusso delle particelle log-omotopico, dimostrando che la densità transiente segue un gradiente di Fisher-Rao e derivando flussi approssimati Gaussiani e a miscela che, in casi specifici, si riducono al flusso esatto di Daum e Huang o ne migliorano l'espressività.

Yinzhuang Yi, Jorge Cortés, Nikolay Atanasov2026-03-06💻 cs

Ice Cream Doesn't Cause Drowning: Benchmarking LLMs Against Statistical Pitfalls in Causal Inference

Il paper introduce CausalPitfalls, un benchmark completo progettato per valutare rigorosamente le capacità di ragionamento causale statistico dei modelli linguistici di grandi dimensioni, evidenziando le loro attuali limitazioni nel superare errori comuni come la paradosso di Simpson e il bias di selezione.

Jin Du, Li Chen, Xun Xian + 6 more2026-03-06💻 cs

← Precedente Successivo →