stat.ML articoli | Gist.Science

SPPCSO: Adaptive Penalized Estimation Method for High-Dimensional Correlated Data

Il documento presenta SPPCSO, un innovativo metodo di stima penalizzata che integra la regressione su componenti principali e la regolarizzazione $L_1$ per garantire stabilità e selezione coerente delle variabili in dati ad alta dimensionalità e fortemente correlati, dimostrando efficacia sia in simulazioni numeriche che nell'analisi di dati di espressione genica.

Ying Hu, Hu YangMon, 09 Ma🤖 cs.LG

Synthetic Monitoring Environments for Reinforcement Learning

Il documento presenta gli Ambienti di Monitoraggio Sintetici (SME), una suite infinita di compiti di controllo continuo con politiche ottimali note, progettata per fornire diagnosi precise e trasparenti delle prestazioni degli agenti di Reinforcement Learning attraverso la valutazione sistematica sia in-distribution che out-of-distribution.

Leonard Pleiss, Carolin Schmidt, Maximilian SchifferMon, 09 Ma🤖 cs.LG

Robust support vector model based on bounded asymmetric elastic net loss for binary classification

Questo articolo propone il BAEN-SVM, un nuovo modello di classificazione binaria basato su una funzione di perdita elastica netta asimmetrica limitata che garantisce robustezza al rumore, consistenza teorica e prestazioni superiori rispetto alle SVM tradizionali, risolvendo il problema di ottimizzazione non convessa tramite un algoritmo specifico.

Haiyan Du, Hu YangMon, 09 Ma🤖 cs.LG

Certified and accurate computation of function space norms of deep neural networks

Questo lavoro presenta un framework per il calcolo certificato e accurato delle norme negli spazi funzionali (come Lebesgue e Sobolev) delle reti neurali profonde, combinando l'aritmetica intervallare, la raffinamento adattivo e l'aggregazione basata su quadratura per ottenere limiti deterministici garantiti sugli integrali delle funzioni e delle loro derivate, superando i limiti delle valutazioni puntuali.

Johannes Gründler, Moritz Maibaum, Philipp PetersenMon, 09 Ma🤖 cs.LG

Bayesian Additive Distribution Regression

Il paper presenta DistBART, un approccio bayesiano non parametrico per la regressione distribuzionale che utilizza ensemble di alberi decisionali per modellare funzionali lineari, offrendo sia risultati teorici sulla concentrazione che una scalabilità computazionale tramite approssimazione a caratteristiche casuali.

Antonio R. Linero, Soumyabrata Bose, Jared MurrayMon, 09 Ma📊 stat

Semantics-Aware Caching for Concept Learning

Il paper presenta un approccio di caching consapevole della semantica che riduce il tempo di esecuzione dell'apprendimento dei concetti di un ordine di grandezza, migliorando l'efficienza sia per i ragionatori simbolici che per quelli neuro-simbolici.

Louis Mozart Kamdem Teyou, Caglar Demir, Axel-Cyrille Ngonga NgomoMon, 09 Ma🤖 cs.LG

Bounds on Representation-Induced Confounding Bias for Treatment Effect Estimation

Questo articolo propone un nuovo quadro di refutazione agnostico rispetto alla rappresentazione, basato su reti neurali, per stimare i limiti del bias di confondimento indotto dalla riduzione dimensionale nell'analisi dell'effetto causale del trattamento, permettendo così di identificare parzialmente l'effetto e quantificare l'incertezza quando le rappresentazioni a bassa dimensionalità compromettono la validità delle stime.

Valentyn Melnychuk, Dennis Frauen, Stefan FeuerriegelFri, 13 Ma📊 stat

Onflow: a model free, online portfolio allocation algorithm robust to transaction fees

Il paper introduce Onflow, un algoritmo di allocazione di portafoglio basato sul reinforcement learning e sui gradienti flow che, non richiedendo assunzioni sulla distribuzione dei rendimenti, ottimizza i log-rendimenti attesi e dimostra una superiorità rispetto alle tecniche esistenti in scenari con elevati costi di transazione.

Gabriel Turinici, Pierre BrugiereFri, 13 Ma💰 q-fin

Geometry of Singular Foliations and Learning Manifolds in ReLU Networks via the Data Information Matrix

Il paper propone l'uso della Matrice di Informazione sui Dati (DIM) derivata da una rete neurale ReLU per rivelare una struttura di fogliatura singolare nello spazio dei dati, dimostrando che tale struttura esiste quasi ovunque e può essere sfruttata per misurare le distanze tra dataset e facilitare il trasferimento di conoscenza.

Eliot Tron, Rita FioresiFri, 13 Ma📊 stat

Are Bayesian networks typically faithful?

Il paper dimostra che le reti bayesiane fedeli costituiscono un insieme denso e aperto in diverse classi parametriche e non parametriche, confermando che l'ipotesi di fedeltà è tipica e garantendo la consistenza degli algoritmi di scoperta causale vincolata su tali insiemi.

Philip Boeken, Patrick Forré, Joris M. MooijFri, 13 Ma📊 stat

Quantifying Aleatoric Uncertainty of the Treatment Effect: A Novel Orthogonal Learner

Questo articolo propone l'AU-learner, un nuovo algoritmo ortogonale basato sull'identificazione parziale e sull'apprendimento profondo per quantificare l'incertezza aleatoria degli effetti terapeutici stimando i limiti della distribuzione condizionale dell'effetto del trattamento.

Valentyn Melnychuk, Stefan Feuerriegel, Mihaela van der SchaarFri, 13 Ma📊 stat

Finance-Informed Neural Network: Learning the Geometry of Option Pricing

Il paper propone FINN, una rete neurale auto-supervisionata che apprende la geometria della valutazione delle opzioni attraverso la replica dinamica e la copertura del rischio, garantendo coerenza economica e superando i limiti dei modelli parametrici tradizionali in ambienti di volatilità stocastica e per asset privi di mercato delle opzioni.

Amine M. Aboussalah, Xuanze Li, Cheng Chi, Raj PatelFri, 13 Ma💰 q-fin

Adaptive Prior Selection in Gaussian Process Bandits with Thompson Sampling

Questo lavoro propone due algoritmi, PE-GP-TS e HP-GP-TS, basati sul campionamento di Thompson per i processi gaussiani, che selezionano adattivamente i prior sconosciuti e minimizzano il rimpianto nella ottimizzazione black-box, fornendo sia garanzie teoriche che validazione empirica.

Jack Sandberg, Morteza Haghir ChehreghaniFri, 13 Ma📊 stat

Weighted Random Dot Product Graphs

Questo articolo introduce un modello non parametrico di Grafo a Prodotto Scalare Casuale Pesato (WRDPG) che estende l'analisi delle reti ai grafi con pesi eterogenei, permettendo di discriminare distribuzioni di pesi con la stessa media ma momenti superiori diversi, e fornisce stime statistiche coerenti per le posizioni latenti dei nodi insieme a un framework generativo per la simulazione di tali grafi.

Bernardo Marenco, Paola Bermolen, Marcelo Fiori, Federico Larroca, Gonzalo MateosFri, 13 Ma📊 stat

Distribution estimation via Flow Matching with Lipschitz guarantees

Questo lavoro migliora la comprensione teorica del Flow Matching derivando un tasso di convergenza per la distanza di Wasserstein 1 che supera i risultati precedenti negli ambienti ad alta dimensionalità, senza richiedere l'assunzione di log-concavità e controllando la dipendenza dalla costante di Lipschitz.

Lea KunkelFri, 13 Ma📊 stat

Busemann Functions in the Wasserstein Space: Existence, Closed-Forms, and Applications to Slicing

Questo lavoro indaga l'esistenza e il calcolo delle funzioni di Busemann nello spazio di Wasserstein, fornendo espressioni in forma chiusa per distribuzioni unidimensionali e misure gaussiane che abilitano nuovi schemi di proiezione e distanze Sliced-Wasserstein applicati con successo a dataset sintetici e problemi di transfer learning.

Clément Bonet, Elsa Cazelles, Lucas Drumetz, Nicolas CourtyFri, 13 Ma📊 stat

Refereed Learning

Questo lavoro introduce il paradigma dell'apprendimento sotto supervisione di un arbitro, in cui un apprendista valuta modelli opachi confrontando due provatori in competizione (uno onesto e uno disonesto), dimostrando che tale approccio consente di identificare il modello migliore con una precisione elevatissima e un costo di query e comunicazione drasticamente inferiori rispetto ai metodi tradizionali.

Ran Canetti, Ephraim Linder, Connor WagamanFri, 13 Ma📊 stat

Belief Dynamics Reveal the Dual Nature of In-Context Learning and Activation Steering

Questo lavoro propone un quadro bayesiano unificato che spiega come l'apprendimento in contesto e lo steering delle attivazioni controllino i modelli linguistici modificando le loro credenze latenti, rispettivamente attraverso l'accumulo di evidenze e la variazione dei prior, permettendo di prevedere e spiegare fenomeni comportamentali complessi come le curve di apprendimento sigmoidee e le transizioni brusche.

Eric Bigelow, Daniel Wurgaft, YingQiao Wang, Noah Goodman, Tomer Ullman, Hidenori Tanaka, Ekdeep Singh LubanaFri, 13 Ma📊 stat

Approximate Bayesian inference for cumulative probit regression models

Questo articolo propone tre algoritmi scalabili basati su Variational Bayes e Expectation Propagation per l'inferenza approssimata nei modelli di regressione probit cumulativa, offrendo prestazioni computazionali superiori e un'accuratezza notevole rispetto ai metodi MCMC tradizionali, come dimostrato anche in uno studio di caso sulla struttura di una rete criminale.

Emanuele AlivertiFri, 13 Ma📊 stat

Entropic Confinement and Mode Connectivity in Overparameterized Neural Networks

Il paper risolve il paradosso tra la connettività dei minimi di perdita nei network neurali e la loro localizzazione durante l'ottimizzazione, dimostrando che barriere entropiche generate dalle variazioni di curvatura e dal rumore dinamico confinano efficacemente le traiettorie di apprendimento all'interno di singoli bacini di attrazione.

Luca Di Carlo, Chase Goddard, David J. SchwabFri, 13 Ma📊 stat

← Precedente Successivo →