stat.ML articoli | Gist.Science

Invariance-Based Dynamic Regret Minimization

Il paper propone l'algoritmo ISD-linUCB per i banditi lineari stocastici non stazionari, il quale migliora le prestazioni riducendo la dimensionalità del problema sfruttando le invarianze nei dati storici decomponendo il modello di ricompensa in componenti stazionarie e non stazionarie.

Margherita Lazzaretto, Jonas Peters, Niklas Pfister2026-03-05🤖 cs.LG

Hierarchical Inference and Closure Learning via Adaptive Surrogates for ODEs and PDEs

Questo articolo presenta un metodo gerarchico bayesiano che combina inferenza parametrica e modelli di chiusura basati su machine learning per risolvere problemi inversi in ODE e PDE, utilizzando algoritmi di campionamento avanzati e un'ottimizzazione bilevel per addestrare simultaneamente surrogate efficienti come FNO e PINN.

Pengyu Zhang, Arnaud Vadeboncoeur, Alex Glyn-Davies + 1 more2026-03-05🤖 cs.LG

Fixed-Budget Constrained Best Arm Identification in Grouped Bandits

Il documento presenta un limite inferiore per l'errore e propone l'algoritmo FCSR per l'identificazione dell'arma migliore in un contesto di banditi raggruppati con vincoli di fattibilità, dimostrando la sua ottimalità teorica e le superiori prestazioni empiriche.

Raunak Mukherjee, Sharayu Moharir2026-03-05🤖 cs.LG

Exploiting Subgradient Sparsity in Max-Plus Neural Networks

Questo lavoro propone un algoritmo di sottogradienti sparsi che sfrutta la struttura algebrica delle reti neurali Max-Plus per ottimizzare in modo efficiente la perdita del peggior campione, trasformando la sparsità naturale dei sottogradienti in un vantaggio computazionale senza compromettere le garanzie teoriche.

Ikhlas Enaieh, Olivier Fercoq2026-03-05🤖 cs.LG

Stable and Steerable Sparse Autoencoders with Weight Regularization

Questo studio dimostra che l'aggiunta di regolarizzazione dei pesi (in particolare L2) agli autoencoder sparsi migliora significativamente la stabilità e la riproducibilità delle caratteristiche apprese, aumentando la coerenza tra diversi semi casuali e raddoppiando il successo del controllo direzionale (steering) senza compromettere la qualità delle interpretazioni automatizzate.

Piotr Jedryszek, Oliver M. Crook2026-03-05🤖 cs.LG

Beyond Mixtures and Products for Ensemble Aggregation: A Likelihood Perspective on Generalized Means

Questo lavoro propone un formalismo unificato per l'aggregazione di densità basato sulle medie generalizzate, dimostrando teoricamente e validando empiricamente che solo l'intervallo $r \in [0,1]$ garantisce miglioramenti sistematici rispetto alle distribuzioni individuali, fornendo così una giustificazione rigorosa per l'uso diffuso della media lineare ( $r=1$ ) e geometrica ( $r=0$ ) negli ensemble di deep learning.

Raphaël Razafindralambo, Rémy Sun, Frédéric Precioso + 2 more2026-03-05🤖 cs.LG

Semi-Supervised Generative Learning via Latent Space Distribution Matching

Il paper introduce LSDM, un nuovo framework semi-supervisionato per la generazione condizionale che apprende uno spazio latente utilizzando dati sia accoppiati che non accoppiati e allinea le distribuzioni congiunte tramite la distanza di Wasserstein, migliorando la fedeltà geometrica e fornendo nuove basi teoriche anche per i Latent Diffusion Models.

Kwong Yu Chong, Long Feng2026-03-05🤖 cs.LG

PTOPOFL: Privacy-Preserving Personalised Federated Learning via Persistent Homology

Il paper presenta PTOPOFL, un framework di apprendimento federato personalizzato che garantisce la privacy e migliora le prestazioni su dati non-IID sostituendo la condivisione dei gradienti con descrittori topologici derivati dall'omologia persistente, riducendo drasticamente il rischio di ricostruzioni dei dati e ottenendo risultati superiori rispetto agli approcci esistenti.

Kelly L Vomo-Donfack, Adryel Hoszu, Grégory Ginot + 1 more2026-03-05🤖 cs.LG

From Reachability to Learnability: Geometric Design Principles for Quantum Neural Networks

Questo studio ridefinisce la progettazione delle reti neurali quantistiche passando dalla semplice raggiungibilità degli stati alla geometria controllabile delle rappresentazioni nascoste, introducendo il criterio di quasi completa selettività locale (aCLS) per dimostrare che l'apprendimento delle caratteristiche richiede una dipendenza congiunta tra dati e pesi addestrabili, garantendo così migliori prestazioni con minori risorse computazionali.

Vishal S. Ngairangbam, Michael Spannowsky2026-03-03⚛️ quant-ph

Denoising Diffusion Probabilistic Models

Questo paper presenta modelli di diffusione probabilistica per la sintesi di immagini di alta qualità, ottenendo risultati all'avanguardia su CIFAR10 e LSUN grazie a un legame innovativo con il denoising score matching e un approccio di decompressione progressiva.

Jonathan Ho, Ajay Jain, Pieter Abbeel2020-06-19🤖 cs.LG

Scaling Laws for Neural Language Models

Il paper stabilisce leggi empiriche secondo cui le prestazioni dei modelli linguistici seguono una legge di potenza rispetto a dimensioni del modello, dataset e calcolo, dimostrando che l'allocazione ottimale delle risorse computazionali prevede l'addestramento di modelli molto grandi su dataset relativamente piccoli e l'arresto dell'addestramento ben prima della convergenza.

Jared Kaplan, Sam McCandlish, Tom Henighan + 7 more2020-01-23🤖 cs.LG

Generative Adversarial Networks

Gli autori propongono un nuovo framework basato su un processo avversariale in cui una rete generativa e una discriminativa vengono addestrate simultaneamente per modellare la distribuzione dei dati senza ricorrere a catene di Markov o inferenza approssimata.

Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza + 5 more2014-06-10📊 stat.ML

Auto-Encoding Variational Bayes

Questo articolo introduce un algoritmo di inferenza variazionale stocastica basato su un ricalcolo del limite inferiore che, sfruttando un modello di riconoscimento e metodi di discesa del gradiente stocastico, permette un'apprendimento efficiente su grandi dataset e in presenza di variabili latenti continue con distribuzioni posteriori intrattabili.

Diederik P Kingma, Max Welling2013-12-20📊 stat.ML

← Precedente