stat.ML articoli | Gist.Science

The Role of Feature Interactions in Graph-based Tabular Deep Learning

Lo studio dimostra che i metodi attuali di deep learning tabulare basato su grafi falliscono nel recuperare le vere interazioni tra le caratteristiche, ma che imporre la corretta struttura del grafo migliora significativamente la precisione predittiva, evidenziando la necessità di dare priorità alla modellazione accurata della struttura rispetto alla sola ottimizzazione della performance.

Elias Dubbeldam, Reza Mohammadi, Marit Schoonhoven, S. Ilker BirbilTue, 10 Ma🤖 cs.LG

Wasserstein Gradient Flows for Scalable and Regularized Barycenter Computation

Il paper propone un metodo scalare e regolarizzato per il calcolo dei baricentri di Wasserstein basato su flussi gradiente, che supera i limiti delle tecniche esistenti integrando mini-batch, regolarizzazione modulare e informazioni supervisionate, ottenendo risultati all'avanguardia in ambiti come visione artificiale e neuroscienze.

Eduardo Fernandes Montesuma, Yassir Bendou, Mike GartrellTue, 10 Ma🤖 cs.LG

Bayesian neural networks with interpretable priors from Mercer kernels

Il paper introduce i "Mercer priors", una nuova classe di prior per le reti neurali bayesiane derivata dalla rappresentazione di Mercer dei kernel di covarianza, che permettono di approssimare i processi gaussiani mantenendo la scalabilità delle reti neurali e garantendo una quantificazione dell'incertezza interpretabile.

Alex Alberts, Ilias BilionisTue, 10 Ma🤖 cs.LG

Shortcut Invariance: Targeted Jacobian Regularization in Disentangled Latent Space

Il paper propone un metodo di regolarizzazione nello spazio latente che, identificando gli assi correlati alle scorciatoie in uno spazio disaccoppiato e iniettando rumore anisotropo mirato, impone un'invarianza funzionale per migliorare la generalizzazione fuori distribuzione senza richiedere etichette di scorciatoia o esempi conflittuali.

Shivam Pal, Sakshi Varshney, Piyush RaiTue, 10 Ma🤖 cs.LG

Beyond Additivity: Sparse Isotonic Shapley Regression toward Nonlinear Explainability

Il documento presenta la Sparse Isotonic Shapley Regression (SISR), un nuovo framework unificato per l'IA spiegabile che supera i limiti dell'additività e della densità dei valori Shapley tradizionali, apprendendo simultaneamente una trasformazione monotona non lineare e imponendo vincoli di sparsità per fornire attribuzioni robuste, efficienti e teoricamente fondate in scenari complessi.

Jialai SheTue, 10 Ma🤖 cs.LG

Topological Spatial Graph Coarsening

Questo lavoro propone un metodo di coarsening per grafi spaziali, privo di parametri e invariante rispetto a trasformazioni geometriche, che riduce la dimensione della rete preservandone le caratteristiche topologiche attraverso l'uso di un nuovo filtraggio "triangle-aware" e diagrammi di persistenza adattati.

Anna Calissano, Etienne LasalleTue, 10 Ma🤖 cs.LG

Sparse Offline Reinforcement Learning with Corruption Robustness

Questo lavoro propone metodi actor-critic con oracoli di stima robusta e sparsa che forniscono i primi garanzie non vuote per l'apprendimento di politiche quasi ottimali in MDP ad alta dimensionalità e sparsi, anche in presenza di forte corruzione dei dati e sotto l'ipotesi di concentrabilità di una singola politica.

Nam Phuong Tran, Andi Nika, Goran Radanovic, Long Tran-Thanh, Debmalya MandalTue, 10 Ma🤖 cs.LG

From Mice to Trains: Amortized Bayesian Inference on Graph Data

Questo lavoro adatta l'inferenza bayesiana ammortizzata ai dati grafici, proponendo una pipeline a due moduli che combina encoder grafici invariante per permutazione e stimatori neurali per effettuare un'inferenza rapida e senza verosimiglianza su parametri a livello di nodo, arco e grafo, con validazione su dati sintetici e reali nei campi della biologia e della logistica.

Svenja Jedhoff, Elizaveta Semenova, Aura Raulo, Anne Meyer, Paul-Christian BürknerTue, 10 Ma🤖 cs.LG

Scalable multitask Gaussian processes for complex mechanical systems with functional covariates

Questo lavoro propone un modello scalabile di processi gaussiani multitask con covariate funzionali, che sfrutta una struttura di kernel separabile e la proprietà di Kronecker per gestire efficientemente sistemi meccanici complessi, offrendo previsioni accurate con intervalli di confidenza anche con pochi campioni e superando le prestazioni dei modelli a task singolo.

Razak Christophe Sabi Gninkou (UPHF, INSA Hauts-De-France, CERAMATHS), Andrés F. López-Lopera (IMAG, LEMON, UM), Franck Massa (LAMIH, INSA Hauts-De-France, UPHF), Rodolphe Le Riche (LIMOS, UCA [2017-2020], ENSM ST-ETIENNE, CNRS)Tue, 10 Ma🔢 math

The Partition Principle Revisited: Non-Equal Volume Designs Achieve Minimal Expected Star Discrepancy

Questo articolo dimostra che le partizioni non a volume uguale producono un errore di discrepanza stellata atteso inferiore rispetto al campionamento jittered classico, fornendo nuovi limiti superiori e una base teorica per l'integrazione numerica in alta dimensione.

Xiaoda XuTue, 10 Ma🤖 cs.LG

Khatri-Rao Clustering for Data Summarization

Il paper introduce il paradigma di clustering Khatri-Rao, che estende i metodi di clustering basati su centroidi (come k-Means e il deep clustering) decomponendo i centroidi in insiemi più compatti di protocentroidi per generare riassunti dei dati più concisi senza comprometterne l'accuratezza.

Martino Ciaperoni, Collin Leiber, Aristides Gionis, Heikki MannilaTue, 10 Ma🤖 cs.LG

Latent Autoencoder Ensemble Kalman Filter for Data assimilation

Il documento propone il LAE-EnKF, un nuovo filtro di Kalman basato su autoencoder latenti che riformula l'assimilazione dei dati in uno spazio latente a dinamica lineare e stabile, superando i limiti di non linearità del filtro di Kalman standard e garantendo maggiore accuratezza e stabilità nei sistemi caotici.

Xin T. Tong, Yanyan Wang, Liang YanTue, 10 Ma🤖 cs.LG

NEST: Network- and Memory-Aware Device Placement For Distributed Deep Learning

Il paper presenta NEST, un framework di posizionamento dei dispositivi per l'addestramento distribuito di deep learning che unifica la parallelizzazione, la modellazione della topologia di rete e la fattibilità della memoria tramite programmazione dinamica strutturata, ottenendo fino a 2,43 volte una maggiore velocità di elaborazione rispetto alle soluzioni esistenti.

Irene Wang, Vishnu Varma Venkata, Arvind Krishnamurthy, Divya MahajanTue, 10 Ma🤖 cs.LG

CREDO: Epistemic-Aware Conformalized Credal Envelopes for Regression

Il paper introduce CREDO, un metodo che combina envelope credali interpretabili con la calibrazione conformale per generare intervalli di previsione per la regressione che garantiscono una copertura valida e decomponibile in rumore aleatorio, inflazione epistemica e slack di calibrazione.

Luben M. C. Cabezas, Sabina J. Sloman, Bruno M. Resende, Fanyi Wu, Michele Caprio, Rafael IzbickiTue, 10 Ma🤖 cs.LG

Bilateral Trade Under Heavy-Tailed Valuations: Minimax Regret with Infinite Variance

Il paper presenta un algoritmo basato su epoche e una corrispondente limite inferiore che caratterizzano il tasso minimax esatto per il regret nel commercio bilaterale contestuale con valutazioni a coda pesante (momento finito $p \in (1,2)$ ), interpolando tra il tasso non parametrico classico e quello lineare.

Hangyi ZhaoTue, 10 Ma🤖 cs.LG

Kernel Methods for Some Transport Equations with Application to Learning Kernels for the Approximation of Koopman Eigenfunctions: A Unified Approach via Variational Methods, Green's Functions and the Method of Characteristics

Il documento presenta un quadro teorico e computazionale unificato che, integrando principi variazionali, funzioni di Green e il metodo delle caratteristiche, costruisce kernel adattati per approssimare gli autovalori dell'operatore di Koopman e risolvere equazioni di trasporto tramite un approccio di ottimizzazione convessa senza griglia.

Boumediene Hamzi, Houman Owhadi, Umesh VaidyaTue, 10 Ma🔢 math

Fairness May Backfire: When Leveling-Down Occurs in Fair Machine Learning

Questo studio dimostra che, mentre l'uso di attributi sensibili nelle decisioni algoritmiche migliora inevitabilmente gli esiti per i gruppi svantaggiati, l'approccio "cieco" agli attributi può paradossalmente peggiorare le condizioni di tutti i gruppi a causa di un effetto di livellamento verso il basso.

Yi Yang, Xiangyu Chang, Pei-yu ChenTue, 10 Ma🤖 cs.LG

Post-Training with Policy Gradients: Optimality and the Base Model Barrier

Il documento dimostra che, sebbene i metodi di Policy Gradient ottimizzino l'addestramento post-preliminare dei modelli autoregressivi lineari tramite ricompense di esito, essi incontrano una barriera fondamentale legata al supporto del modello di base che può richiedere un numero esponenziale di query, barriera che può essere superata utilizzando ricompense di processo che sfruttano una quantile di verosimiglianza a livello di token per evitare la maledizione della dimensionalità.

Alireza Mousavi-Hosseini, Murat A. ErdogduTue, 10 Ma🤖 cs.LG

Masked Unfairness: Hiding Causality within Zero ATE

Questo articolo dimostra come la regolamentazione della fairness basata esclusivamente sull'effetto medio del trattamento (ATE) possa essere aggirata attraverso il "masking causale", nascondendo discriminazioni sistemiche dietro una media nulla e sottolineando la necessità di valutare l'equità a livello di modello piuttosto che di decisione.

Zou Yang, Sophia Xiao, Bijan MazaheriTue, 10 Ma🤖 cs.LG

Combinatorial Allocation Bandits with Nonlinear Arm Utility

Questo articolo propone il nuovo problema di apprendimento online denominato "Combinatorial Allocation Bandits" (CAB), che mira a massimizzare la soddisfazione degli utenti nelle piattaforme di matching attraverso algoritmi basati su limiti di confidenza e Thompson Sampling, superando i limiti delle strategie tradizionali focalizzate solo sul numero di abbinamenti.

Yuki Shibukawa, Koichi Tanaka, Yuta Saito, Shinji ItoTue, 10 Ma🤖 cs.LG

← Precedente Successivo →