stat.ML articoli | Gist.Science

Towards Reliable Simulation-based Inference

Questa tesi affronta il problema della sovrastima della certezza nelle inferenze basate su simulazioni scientifiche, introducendo e validando empiricamente due approcci per migliorare l'affidabilità dei modelli: la tecnica di regolarizzazione "balancing" e l'uso di reti neurali bayesiane con un prior specifico.

Arnaud DelaunoyWed, 11 Ma🤖 cs.LG

Estimation of heterogeneous principal effects under principal ignorability

Questo articolo propone un quadro metodologico per stimare e costruire intervalli di confidenza per effetti causali principali eterogenei in presenza di variabili intermedie binarie, sviluppando stimatori con diverse proprietà di robustezza (doppia e intermedia) sotto l'ipotesi di ignorabilità principale e validandoli empiricamente tramite un trial randomizzato.

Rui Zhang, Charles R. Doss, Jared D. HulingWed, 11 Ma📊 stat

Data-driven robust Markov decision processes on Borel spaces: performance guarantees via an axiomatic approach

Il documento presenta un approccio assiomatico ai processi decisionali di Markov robusti su spazi di Borel con distribuzioni di disturbo sconosciute, dimostrando che l'uso di insiemi di ambiguità basati su distanze empiriche garantisce la convergenza verso il valore ottimo vero e fornisce limiti di prestazione fuori campione con alta probabilità per dimensioni campionarie finite, superando le carenze dei processi decisionali empirici standard.

Sivaramakrishnan RamaniWed, 11 Ma🤖 cs.LG

Statistical Inference via Generative Models: Flow Matching and Causal Inference

Questo libro propone un quadro statistico che interpreta i modelli generativi, in particolare il flow matching, come strumenti per l'apprendimento non parametrico di distribuzioni ad alta dimensionalità, permettendo di integrarli in inferenze causali e analisi di dati mancanti garantendo la validità statistica attraverso tecniche di ortogonalizzazione e cross-fitting.

Shinto EguchiWed, 11 Ma🤖 cs.LG

Verifying Good Regulator Conditions for Hypergraph Observers: Natural Gradient Learning from Causal Invariance via Established Theorems

Questo lavoro verifica che gli osservatori persistenti in substrati di ipergrafi causali soddisfano il Teorema del Buono Regolatore di Conant-Ashby, dimostrando che la discesa del gradiente naturale è l'unica regola di apprendimento ammissibile e derivando una formula chiusa per il parametro di regime di Vanchurin, sebbene tale risultato dipenda fortemente dal modello di convergenza scelto.

Max ZhuravlevWed, 11 Ma🤖 cs.LG

Better Bounds for the Distributed Experts Problem

Questo lavoro presenta un protocollo migliorato per il problema degli esperti distribuiti che riduce il regret e ottimizza la comunicazione necessaria tra i server, superando i risultati precedenti.

David P. Woodruff, Samson ZhouWed, 11 Ma🤖 cs.LG

A Generative Sampler for distributions with possible discrete parameter based on Reversibility

Il paper propone un quadro unificato di campionamento generativo basato sulla reversibilità temporale e sulla minimizzazione della discrepanza MMD tra traiettorie forward e backward, che permette di campionare distribuzioni complesse su spazi continui, discreti o misti senza richiedere gradienti del target o rilassamenti continui, utilizzando solo valutazioni energetiche.

Lei Li, Zhen Wang, Lishuo ZhangWed, 11 Ma🤖 cs.LG

Transductive Generalization via Optimal Transport and Its Application to Graph Node Classification

Questo lavoro stabilisce nuovi limiti di generalizzazione trasduttiva basati sul trasporto ottimo e sulle distanze di Wasserstein, dimostrando che sono efficientemente calcolabili e correlati all'errore empirico nella classificazione di nodi su grafi, rivelando inoltre come l'aggregazione delle GNN influenzi la generalizzazione attraverso un compromesso tra concentrazione intra-classe e separazione inter-classe.

MoonJeong Park, Seungbeom Lee, Kyungmin Kim, Jaeseung Heo, Seunghyuk Cho, Shouheng Li, Sangdon Park, Dongwoo KimWed, 11 Ma🤖 cs.LG

On Regret Bounds of Thompson Sampling for Bayesian Optimization

Questo articolo colma le lacune nell'analisi del regret per il campionamento di Thompson basato su processi gaussiani (GP-TS) fornendo nuovi limiti inferiori, superiori sul secondo momento, limiti attesi di regret "lenient" e un limite superiore cumulativo migliorato rispetto all'orizzonte temporale $T$ .

Shion Takeno, Shogo IwazakiWed, 11 Ma🤖 cs.LG

A Gaussian Comparison Theorem for Training Dynamics in Machine Learning

Questo lavoro presenta un teorema di confronto non asintotico basato sul teorema di Gordon per analizzare la dinamica di addestramento di algoritmi su modelli a mistura gaussiana, dimostrando la validità delle espressioni del campo medio dinamico e proponendo uno schema di raffinamento iterativo per scenari non asintotici.

Ashkan PanahiWed, 11 Ma🤖 cs.LG

Robust Regularized Policy Iteration under Transition Uncertainty

Il paper propone Robust Regularized Policy Iteration (RRPI), un nuovo algoritmo per l'apprendimento per rinforzo offline che affronta l'incertezza di transizione formulando l'ottimizzazione come un problema robusto con regolarizzazione KL, garantendo teoricamente la convergenza e ottenendo prestazioni superiori rispetto agli stati dell'arte su benchmark come D4RL.

Hongqiang Lin, Zhenghui Fu, Weihao Tang, Pengfei Wang, Yiding Sun, Qixian Huang, Dongxu ZhangWed, 11 Ma🤖 cs.AI

Variational Routing: A Scalable Bayesian Framework for Calibrated Mixture-of-Experts Transformers

Il paper introduce VMoER, un approccio bayesiano strutturato che applica l'inferenza variazionale alla fase di routing nelle architetture Mixture-of-Experts, consentendo una quantificazione dell'incertezza calibrata e scalabile per i modelli foundation con un costo computazionale trascurabile.

Albus Yizhuo Li, Matthew WickerWed, 11 Ma🤖 cs.AI

What Do We Care About in Bandits with Noncompliance? BRACE: Bandits with Recommendations, Abstention, and Certified Effects

Il paper introduce BRACE, un algoritmo per i banditi con non conformità che gestisce il trade-off tra il benessere delle raccomandazioni e l'apprendimento dei trattamenti, fornendo intervalli strutturali certificati e identificando politiche ottimali sia per scenari di controllo diretto che mediato, anche in presenza di identificazione debole o eterogeneità.

Nicolás Della PennaWed, 11 Ma🤖 cs.LG

a-TMFG: Scalable Triangulated Maximally Filtered Graphs via Approximate Nearest Neighbors

Il paper presenta a-TMFG, un nuovo algoritmo scalabile che supera i limiti di memoria e tempo del TMFG tradizionale costruendo grafi da dati su larga scala (fino a milioni di osservazioni) tramite l'uso di grafi dei k-vicini più prossimi e una gestione dinamica delle correlazioni, rendendoli adatti per l'apprendimento automatico supervisionato e non supervisionato.

Lionel YelibiWed, 11 Ma🤖 cs.LG

MM-algorithms for traditional and convex NMF with Tweedie and Negative Binomial cost functions and empirical evaluation

Questo articolo presenta un quadro unificato per la fattorizzazione di matrici non negative (NMF) tradizionale e convessa basato su distribuzioni Tweedie e Binomiale Negativa, derivando regole di aggiornamento moltiplicativo tramite algoritmi MM e dimostrandone l'efficacia empirica su dati reali.

Elisabeth Sommer James, Asger Hobolth, Marta PelizzolaWed, 11 Ma🤖 cs.LG

Murmurations: a case study in AI-assisted mathematics

Il documento presenta il fenomeno matematico delle "murmurazioni", scoperto sperimentalmente tramite l'ausilio dell'intelligenza artificiale su grandi dataset aritmetici, che rivela nuove connessioni tra le tracce di Frobenius, la teoria delle matrici casuali e la congettura di Birch e Swinnerton-Dyer.

Yang-Hui He, Kyu-Hwan Lee, Thomas Oliver, Alexey PozdnyakovWed, 11 Ma📊 stat

Upper Generalization Bounds for Neural Oscillators

Questo studio deriva nuovi limiti superiori di generalizzazione PAC per gli oscillatori neurali basati su equazioni differenziali ordinarie del secondo ordine, dimostrando teoricamente e validando numericamente che la regolarizzazione dei Lipschitz delle reti MLP mitiga la complessità parametrica e migliora le prestazioni nell'approssimazione di sistemi strutturali non lineari.

Zifeng Huang, Konstantin M. Zuev, Yong Xia, Michael BeerWed, 11 Ma🤖 cs.LG

A Unified Hierarchical Multi-Task Multi-Fidelity Framework for Data-Efficient Surrogate Modeling in Manufacturing

Questo articolo presenta un nuovo framework gerarchico multi-task e multi-fidelity per la modellazione surrogata basata su processi gaussiani, che integra informazioni tra compiti correlati e livelli di fedeltà variabili per migliorare l'accuratezza predittiva e la quantificazione dell'incertezza in contesti manifatturieri con dati eterogenei.

Manan Mehta, Zhiqiao Dong, Yuhang Yang, Chenhui ShaoWed, 11 Ma🤖 cs.LG

On the Width Scaling of Neural Optimizers Under Matrix Operator Norms I: Row/Column Normalization and Hyperparameter Transfer

Il paper introduce una famiglia di ottimizzatori basati su norme operatorie normalizzate, culminanti nell'algoritmo MOGA, che garantisce una stabilità e un trasferimento dei tassi di apprendimento indipendenti dalla larghezza della rete, superando i limiti di metodi esistenti come AdamW e Muon.

Ruihan Xu, Jiajin Li, Yiping LuWed, 11 Ma🤖 cs.LG

Online Neural Networks for Change-Point Detection

Questo articolo presenta due approcci di rilevamento dei punti di cambiamento basati su reti neurali e apprendimento online, caratterizzati da complessità computazionale lineare e prestazioni superiori rispetto agli algoritmi esistenti su dati sintetici e reali, con una dimostrazione teorica della loro convergenza verso soluzioni ottimali.

Mikhail Hushchyn, Kenenbek Arzymatov, Denis DerkachTue, 10 Ma🤖 cs.LG

← Precedente Successivo →