stat.ML articoli | Gist.Science

Beyond ReinMax: Low-Variance Gradient Estimators for Discrete Latent Variables

Questo lavoro introduce gli stimatori ReinMax-Rao e ReinMax-CV, che riducono la varianza dello stimatore ReinMax tramite tecniche di Rao-Blackwellizzazione e variabili di controllo, migliorando così l'addestramento di autoencoder variazionali con spazi latenti discreti.

Daniel Wang, Thang D. BuiTue, 10 Ma🤖 cs.LG

Posterior Sampling Reinforcement Learning with Gaussian Processes for Continuous Control: Sublinear Regret Bounds for Unbounded State Spaces

Questo lavoro risolve le limitazioni teoriche precedenti sull'algoritmo GP-PSRL per il controllo continuo, dimostrando che, anche in spazi di stato illimitati, è possibile ottenere un limite di rimpianto bayesiano sublineare dell'ordine $\widetilde{\mathcal{O}}(H^{3/2}\sqrt{\gamma_{T/H} T})$ attraverso l'uso di disuguaglianze probabilistiche avanzate e il metodo di chaining.

Hamish Flynn, Joe Watson, Ingmar Posner, Jan PetersTue, 10 Ma🤖 cs.LG

Towards plausibility in time series counterfactual explanations

Il paper presenta un nuovo metodo basato su ottimizzazione del gradiente che genera spiegazioni controfattuali plausibili per la classificazione di serie temporali, integrando l'allineamento soft-DTW con i vicini più prossimi per garantire una struttura temporale realistica e superare i limiti delle approcci esistenti.

Marcin Kostrzewa, Krzysztof Galus, Maciej Zi\k{e}baTue, 10 Ma🤖 cs.LG

Unifying On- and Off-Policy Variance Reduction Methods

Questo articolo unifica i metodi di riduzione della varianza per la valutazione on-policy e off-policy, dimostrando l'equivalenza matematica tra gli stimatori standard di differenza di medie e quelli di punteggio di propensione inversa, nonché tra le tecniche di aggiustamento tramite regressione e la stima robusta doppia.

Olivier JeunenTue, 10 Ma🤖 cs.LG

Beyond the Markovian Assumption: Robust Optimization via Fractional Weyl Integrals in Imbalanced Data

Questo articolo propone un nuovo algoritmo di ottimizzazione basato sul calcolo frazionario che, sostituendo il gradiente istantaneo con un operatore di memoria storica ponderata, supera i limiti degli approcci markoviani tradizionali per migliorare significativamente l'accuratezza e la robustezza nella gestione di dati sbilanciati come quelli relativi alla frode finanziaria e alla diagnosi medica.

Gustavo A. DorregoTue, 10 Ma🤖 cs.LG

Efficient Credal Prediction through Decalibration

Il paper propone un metodo efficiente chiamato "decalibrazione" per generare insiemi credali tramite intervalli di probabilità, permettendo la stima dell'incertezza epistemica in modelli complessi come TabPFN e CLIP senza richiedere il costoso riaddestramento di ensemble.

Paul Hofman, Timo Löhr, Maximilian Muschalik, Yusuf Sale, Eyke HüllermeierTue, 10 Ma🤖 cs.LG

Breaking the Bias Barrier in Concave Multi-Objective Reinforcement Learning

Questo lavoro risolve il problema del bias nei metodi di gradiente della politica per l'apprendimento per rinforzo multi-obiettivo con scalizzazione concava, proponendo un algoritmo Natural Policy Gradient basato su stimatori Monte Carlo a più livelli che garantisce una complessità di campionamento ottimale $\widetilde{\mathcal{O}}(\epsilon^{-2})$ .

Swetha Ganesh, Vaneet AggarwalTue, 10 Ma🤖 cs.LG

Generative Adversarial Regression (GAR): Learning Conditional Risk Scenarios

Il paper propone Generative Adversarial Regression (GAR), un framework che utilizza una formulazione minimax per addestrare generatori capaci di apprendere scenari di rischio condizionati allineati con obiettivi elicibili (come VaR e ES), garantendo una migliore preservazione del rischio a valle rispetto ai metodi tradizionali.

Saeed Asadi, Jonathan Yu-Meng LiTue, 10 Ma🤖 cs.LG

Impact of Connectivity on Laplacian Representations in Reinforcement Learning

Questo lavoro stabilisce un limite superiore all'errore di approssimazione del valore nelle rappresentazioni spettrali dell'apprendimento per rinforzo, dimostrando come tale errore dipenda dall'algebraica connettività del grafo degli stati e fornendo una decomposizione completa dell'errore end-to-end senza assumere simmetrie nel kernel di transizione.

Tommaso Giorgi, Pierriccardo Olivieri, Keyue Jiang, Laura Toni, Matteo PapiniTue, 10 Ma🤖 cs.LG

Momentum SVGD-EM for Accelerated Maximum Marginal Likelihood Estimation

Il paper propone Momentum SVGD-EM, un metodo accelerato per la stima della massima verosimiglianza marginale che integra l'accelerazione di Nesterov sia negli aggiornamenti dei parametri che nello spazio delle misure di probabilità, ottenendo una convergenza più rapida rispetto alle tecniche esistenti in scenari a bassa e alta dimensionalità.

Adam Rozzio, Rafael Athanasiades, O. Deniz AkyildizTue, 10 Ma🤖 cs.LG

Structural Causal Bottleneck Models

Il paper introduce i modelli causali a collo di bottiglia strutturale (SCBM), una nuova classe di modelli causali che presuppone che gli effetti tra variabili ad alta dimensionalità dipendano solo da statistiche riassuntive a bassa dimensionalità, offrendo un framework flessibile per la riduzione della dimensionalità specifica per il compito e migliorando la stima degli effetti in contesti di apprendimento con pochi dati.

Simon Bing, Jonas Wahl, Jakob RungeTue, 10 Ma🤖 cs.LG

Disjunctive Branch-and-Bound for Certifiably Optimal Low-Rank Matrix Completion

Questo articolo propone un metodo di branch-and-bound disgiuntivo e nuove rilassazioni convesse per risolvere il completamento di matrici a basso rango con garanzia di ottimalità certificata, riducendo significativamente il divario di ottimalità e l'errore di generalizzazione rispetto ai metodi euristici esistenti.

Dimitris Bertsimas, Ryan Cory-Wright, Sean Lo, Jean PauphiletThu, 12 Ma📊 stat

Optimal Transport Aggregation for Distributed Mixture-of-Experts

Questo articolo propone un metodo di aggregazione basato sul trasporto ottimo per combinare modelli Mixture-of-Experts distribuiti in un unico stimatore globale, garantendo efficienza computazionale, bassi costi di comunicazione e prestazioni statistiche comparabili all'addestramento centralizzato.

Faïcel Chamroukhi, Nhat Thien PhamThu, 12 Ma📊 stat

Learning Robust Treatment Rules for Censored Data

Questo articolo propone due criteri robusti e un algoritmo di ottimizzazione per apprendere regole di trattamento ottimali basate su dati di sopravvivenza censurati, mirando a massimizzare il tempo medio di sopravvivenza troncato e le probabilità di sopravvivenza tamponate, con validazione teorica e sperimentale su dati simulati e reali.

Yifan Cui, Junyi Liu, Tao Shen, Zhengling Qi, Xi ChenThu, 12 Ma📊 stat

Exploratory Optimal Stopping: A Singular Control Formulation

Questo articolo propone una formulazione di controllo singolare regolarizzato per problemi di arresto ottimale esplorativo, risolvendoli tramite il principio di programmazione dinamica e sviluppando algoritmi di apprendimento per rinforzo, sia basati su modello che liberi da modello, per identificare strategie ottimali scalabili in spazi ad alta dimensionalità.

Jodi Dianetti, Giorgio Ferrari, Renyuan XuThu, 12 Ma💰 q-fin

EarthquakeNPP: A Benchmark for Earthquake Forecasting with Neural Point Processes

Il paper introduce EarthquakeNPP, un nuovo benchmark che corregge le carenze dei precedenti dataset e dimostra che, nonostante i recenti progressi, i processi puntuali neurali attuali non superano ancora le prestazioni del modello ETAS classico per la previsione sismica.

Samuel Stockman, Daniel Lawson, Maximilian WernerThu, 12 Ma🔬 physics

Losing dimensions: Geometric memorization in generative diffusion

Questo studio rivela che i modelli di diffusione non memorizzano i dati in modo improvviso, ma subiscono un collasso geometrico graduale in cui, all'aumentare della scarsità dei dati, le capacità generative si restringono progressivamente su pochi esempi, passando dalla generalizzazione alla copia puntuale attraverso un processo di "congelamento" delle variazioni.

Beatrice Achilli, Enrico Ventura, Gianluigi Silvestri, Bao Pham, Gabriel Raya, Dmitry Krotov, Carlo Lucibello, Luca AmbrogioniThu, 12 Ma📊 stat

Conditional Local Importance by Quantile Expectations

Il paper propone CLIQUE, un nuovo metodo agnostico rispetto al modello per calcolare l'importanza locale delle variabili che cattura le dipendenze locali e le interazioni, superando i limiti di tecniche come LIME e SHAP e adattandosi nativamente ai problemi di classificazione multiclasse.

Kelvyn K. Bladen, Adele Cutler, D. Richard Cutler, Kevin R. MoonThu, 12 Ma📊 stat

Pairwise Comparisons without Stochastic Transitivity: Model, Theory and Applications

Questo articolo propone una nuova famiglia di modelli statistici per le comparazioni a coppie che, eliminando l'assunzione di transitività stocastica tipica dei modelli Bradley-Terry e Thurstone, utilizza una matrice antisimmetrica a bassa dimensionalità per gestire scenari complessi con dati sparsi, garantendo al contempo ottimalità teorica e prestazioni superiori.

Sze Ming Lee, Yunxiao ChenThu, 12 Ma📊 stat

An Algorithm to perform Covariance-Adjusted Support Vector Classification in Non-Euclidean Spaces

Questo articolo propone un algoritmo chiamato Cholesky-SVM che supera i limiti delle SVM tradizionali negli spazi non euclidei incorporando la covarianza dei dati tramite decomposizione di Cholesky, ottenendo così una classificazione più accurata rispetto ai metodi convenzionali.

Satyajeet Sahoo, Jhareswar MaitiThu, 12 Ma📊 stat

← Precedente Successivo →