stat.ML articoli | Gist.Science

Learning under Distributional Drift: Prequential Reproducibility as an Intrinsic Statistical Resource

Questo lavoro introduce un budget di deriva intrinseco basato sulla distanza di Fisher-Rao per caratterizzare l'apprendimento statistico in ambienti a ciclo chiuso, dimostrando che la riproducibilità prequenziale è limitata da un errore irriducibile proporzionale al tasso medio di deriva cumulativa.

Sofiya Zaichyk2026-03-05🤖 cs.LG

Synthetic Augmentation in Imbalanced Learning: When It Helps, When It Hurts, and How Much to Add

Questo lavoro propone un quadro statistico unificato che dimostra come l'aumento sintetico nei dati sbilanciati non sia sempre vantaggioso, identificando le condizioni in cui può danneggiare le prestazioni e introducendo una strategia pratica (VTSS) per ottimizzare la quantità di campioni sintetici da generare.

Zhengchi Ma, Anru R. Zhang2026-03-05🤖 cs.LG

Universal Coefficients and Mayer-Vietoris Sequence for Groupoid Homology

Questo articolo studia l'omologia degli groupoidi ampi mediante il complesso di Moore a supporto compatto, dimostrando una sequenza esatta universale dei coefficienti per coefficienti discreti, identificando gli ostacoli per coefficienti non discreti e costruendo una sequenza di Mayer-Vietoris per il calcolo omologico.

Luciano Melodia2026-03-05🤖 cs.LG

Rich Insights from Cheap Signals: Efficient Evaluations via Tensor Factorization

Questo lavoro propone un modello statistico basato sulla fattorizzazione tensoriale che combina valutazioni automatiche a basso costo con un limitato set di dati umani per ottenere valutazioni granulari ed efficienti delle prestazioni dei modelli generativi, superando i colli di bottiglia dei dati e fornendo stime accurate delle preferenze umane senza necessità di nuove annotazioni.

Felipe Maia Polo, Aida Nematzadeh, Virginia Aglietti + 2 more2026-03-05🤖 cs.AI

Causal Learning Should Embrace the Wisdom of the Crowd

Questo articolo propone un nuovo paradigma per l'apprendimento causale che integra piattaforme di crowdsourcing, modelli di esperti umani e agenti LLM in un framework distribuito per sintetizzare conoscenze frammentarie e ricostruire strutture causali globali altrimenti irraggiungibili.

Ryan Feng Lin, Yuantao Wei, Huiling Liao + 2 more2026-03-05🤖 cs.LG

The Theory behind UMAP?

Questo articolo corregge gli errori presenti nella teoria originale di UMAP proposta da McInnes et al., fornendo una derivazione completa e autonoma dei funtori di Spivak e una descrizione esplicita della loro variante finita utilizzata nell'algoritmo.

David Wegmann2026-03-05🤖 cs.LG

Learning Order Forest for Qualitative-Attribute Data Clustering

Questo articolo propone il "Learning Order Forest", un metodo di clustering che utilizza una struttura ad albero per rappresentare le relazioni d'ordine tra valori di attributi qualitativi, ottimizzando congiuntamente la struttura degli alberi e i cluster per ottenere risultati più accurati rispetto alle tecniche tradizionali basate sulla distanza euclidea.

Mingjie Zhao, Sen Feng, Yiqun Zhang + 3 more2026-03-05🤖 cs.AI

Beyond Cross-Validation: Adaptive Parameter Selection for Kernel-Based Gradient Descents

Questo articolo propone una strategia adattiva per la selezione dei parametri negli algoritmi di discesa del gradiente basati su kernel, che integra l'analisi bias-varianza con il metodo di splitting e la dimensione empirica efficace, garantendo teoricamente un errore di generalizzazione ottimale e un adattamento superiore rispetto ai metodi esistenti.

Xiaotong Liu, Yunwen Lei, Xiangyu Chang + 1 more2026-03-05🤖 cs.LG

Surprisal-Rényi Free Energy

Questo lavoro introduce l'Energia Libera di Surprisal-Rényi (SRFE), un funzionale log-momentale che generalizza le divergenze KL forward e reverse, rivelando un compromesso esplicito tra media e varianza e fornendo una caratterizzazione variazionale e una interpretazione basata sulla Lunghezza Minima di Descrizione per il controllo delle grandi deviazioni.

Shion Matsumoto, Raul Castillo, Benjamin Prada + 1 more2026-03-05🤖 cs.LG

Scalable Contrastive Causal Discovery under Unknown Soft Interventions

Il paper propone un modello scalabile per la scoperta causale che, sfruttando dati osservazionali e interventivi soft con target ignoti, integra regole di orientamento contrastive per ricostruire una struttura causale globale coerente, garantendo teoricamente il recupero asintotico del PDAG identificabile e dimostrando empiricamente migliori prestazioni di generalizzazione e scalabilità.

Mingxuan Zhang, Khushi Desai, Sopho Kevlishvili + 1 more2026-03-05🤖 cs.LG

Minimax Optimal Strategy for Delayed Observations in Online Reinforcement Learning

Questo lavoro propone un algoritmo minimamente ottimo per l'apprendimento per rinforzo con osservazioni dello stato ritardate, ottenendo un limite di rimpianto $\tilde{\mathcal{O}}(H \sqrt{D_{\max} SAK})$ e fornendo una corrispondente limite inferiore che ne conferma l'ottimalità.

Harin Lee, Kevin Jamieson2026-03-05🤖 cs.LG

Solving adversarial examples requires solving exponential misalignment

Lo studio dimostra che la vulnerabilità agli esempi avversari deriva da un disallineamento esponenziale tra le varietà percettive delle reti neurali e quelle umane, suggerendo che la robustezza può essere raggiunta solo allineando la dimensionalità di questi spazi concettuali.

Alessandro Salvatore, Stanislav Fort, Surya Ganguli2026-03-05🤖 cs.LG

Controllable Generative Sandbox for Causal Inference

Il paper introduce CausalMix, un framework generativo variazionale che colma il divario tra realismo distributivo e controllabilità causale nella sintesi di dati tabellari misti, permettendo la manipolazione indipendente di sovrapposizione, confondimento ed eterogeneità degli effetti per validare studi causali e analisi di potenza.

Qi Zhang, Harsh Parikh, Ashley Naimi + 3 more2026-03-05🤖 cs.LG

Empirical Evaluation of No Free Lunch Violations in Permutation-Based Optimization

Lo studio dimostra che la riformulazione algebrica degli obiettivi e la progettazione dei benchmark generano deviazioni strutturate dall'intuizione del teorema "No Free Lunch", portando a riordinamenti stabili delle prestazioni degli algoritmi che richiedono una scelta consapevole basata sulla classe del problema e sulla rappresentazione dell'obiettivo.

Grzegorz Sroka2026-03-05🔢 math

Extending Neural Operators: Robust Handling of Functions Beyond the Training Set

Questo lavoro presenta un quadro rigoroso per estendere gli operatori neurali al di fuori della distribuzione di addestramento, sfruttando tecniche di approssimazione dei kernel e spazi di Hilbert a nucleo riproducente per garantire la robustezza teorica e l'accuratezza nella risoluzione di equazioni differenziali alle derivate parziali su varietà.

Blaine Quackenbush, Paul J. Atzberger2026-03-05🤖 cs.LG

Riemannian Langevin Dynamics: Strong Convergence of Geometric Euler-Maruyama Scheme

Questo lavoro dimostra la convergenza forte di ordine 1/2 per uno schema geometrico di Eulero-Maruyama applicato alle equazioni differenziali stocastiche su varietà Riemanniane, fornendo inoltre un limite di Wasserstein per il campionamento tramite dinamica di Langevin Riemanniana discretizzata.

Zhiyuan Zhan, Masashi Sugiyama2026-03-05🤖 cs.LG

A Stein Identity for q-Gaussians with Bounded Support

Questo lavoro estende l'identità di Stein alle distribuzioni q-Gaussiane a supporto limitato, derivando nuovi teoremi di tipo Bonnet e Price che permettono di costruire stimatori del gradiente facili da implementare e con varianza ridotta, utili per l'apprendimento profondo bayesiano e la minimizzazione sensibile alla nitidezza.

Sophia Sklaviadis, Thomas Moellenhoff, Andre F. T. Martins + 2 more2026-03-05🤖 cs.LG

Generalization Properties of Score-matching Diffusion Models for Intrinsically Low-dimensional Data

Questo lavoro dimostra che i modelli di diffusione basati sul punteggio adattano la loro velocità di convergenza alla dimensione intrinseca dei dati, superando la maledizione della dimensionalità e fornendo nuovi limiti di errore finiti per distribuzioni con supporto non limitato.

Saptarshi Chakraborty, Quentin Berthet, Peter L. Bartlett2026-03-05🤖 cs.AI

Inverse Contextual Bandits without Rewards: Learning from a Non-Stationary Learner via Suffix Imitation

Il paper propone il framework "Two-Phase Suffix Imitation" per risolvere il problema dell'Inverso Contextual Bandit senza ricompense, dimostrando che un osservatore passivo può recuperare la politica ottimale con un tasso di convergenza di $\tilde O(1/\sqrt{N})$ ignorando i dati iniziali di esplorazione e imitando solo le azioni successive.

Yuqi Kong, Xiao Zhang, Weiran Shen2026-03-05🤖 cs.LG

Observationally Informed Adaptive Causal Experimental Design

Il paper propone il framework R-Design, che utilizza un modello osservazionale come prior per stimare efficientemente i residui di bias tramite l'apprendimento attivo, superando le inefficienze dei trial controllati randomizzati tradizionali e migliorando significativamente l'accuratezza dell'inferenza causale.

Erdun Gao, Liang Zhang, Jake Fawkes + 5 more2026-03-05🤖 cs.LG

← Precedente Successivo →