The Role of Feature Interactions in Graph-based Tabular Deep Learning

Lo studio dimostra che i metodi attuali di deep learning tabulare basato su grafi falliscono nel recuperare le vere interazioni tra le caratteristiche, ma che imporre la corretta struttura del grafo migliora significativamente la precisione predittiva, evidenziando la necessità di dare priorità alla modellazione accurata della struttura rispetto alla sola ottimizzazione della performance.

Elias Dubbeldam, Reza Mohammadi, Marit Schoonhoven, S. Ilker BirbilTue, 10 Ma🤖 cs.LG

Beyond Additivity: Sparse Isotonic Shapley Regression toward Nonlinear Explainability

Il documento presenta la Sparse Isotonic Shapley Regression (SISR), un nuovo framework unificato per l'IA spiegabile che supera i limiti dell'additività e della densità dei valori Shapley tradizionali, apprendendo simultaneamente una trasformazione monotona non lineare e imponendo vincoli di sparsità per fornire attribuzioni robuste, efficienti e teoricamente fondate in scenari complessi.

Jialai SheTue, 10 Ma🤖 cs.LG

From Mice to Trains: Amortized Bayesian Inference on Graph Data

Questo lavoro adatta l'inferenza bayesiana ammortizzata ai dati grafici, proponendo una pipeline a due moduli che combina encoder grafici invariante per permutazione e stimatori neurali per effettuare un'inferenza rapida e senza verosimiglianza su parametri a livello di nodo, arco e grafo, con validazione su dati sintetici e reali nei campi della biologia e della logistica.

Svenja Jedhoff, Elizaveta Semenova, Aura Raulo, Anne Meyer, Paul-Christian BürknerTue, 10 Ma🤖 cs.LG

Scalable multitask Gaussian processes for complex mechanical systems with functional covariates

Questo lavoro propone un modello scalabile di processi gaussiani multitask con covariate funzionali, che sfrutta una struttura di kernel separabile e la proprietà di Kronecker per gestire efficientemente sistemi meccanici complessi, offrendo previsioni accurate con intervalli di confidenza anche con pochi campioni e superando le prestazioni dei modelli a task singolo.

Razak Christophe Sabi Gninkou (UPHF, INSA Hauts-De-France, CERAMATHS), Andrés F. López-Lopera (IMAG, LEMON, UM), Franck Massa (LAMIH, INSA Hauts-De-France, UPHF), Rodolphe Le Riche (LIMOS, UCA [2017-2020], ENSM ST-ETIENNE, CNRS)Tue, 10 Ma🔢 math

NEST: Network- and Memory-Aware Device Placement For Distributed Deep Learning

Il paper presenta NEST, un framework di posizionamento dei dispositivi per l'addestramento distribuito di deep learning che unifica la parallelizzazione, la modellazione della topologia di rete e la fattibilità della memoria tramite programmazione dinamica strutturata, ottenendo fino a 2,43 volte una maggiore velocità di elaborazione rispetto alle soluzioni esistenti.

Irene Wang, Vishnu Varma Venkata, Arvind Krishnamurthy, Divya MahajanTue, 10 Ma🤖 cs.LG

Kernel Methods for Some Transport Equations with Application to Learning Kernels for the Approximation of Koopman Eigenfunctions: A Unified Approach via Variational Methods, Green's Functions and the Method of Characteristics

Il documento presenta un quadro teorico e computazionale unificato che, integrando principi variazionali, funzioni di Green e il metodo delle caratteristiche, costruisce kernel adattati per approssimare gli autovalori dell'operatore di Koopman e risolvere equazioni di trasporto tramite un approccio di ottimizzazione convessa senza griglia.

Boumediene Hamzi, Houman Owhadi, Umesh VaidyaTue, 10 Ma🔢 math

Post-Training with Policy Gradients: Optimality and the Base Model Barrier

Il documento dimostra che, sebbene i metodi di Policy Gradient ottimizzino l'addestramento post-preliminare dei modelli autoregressivi lineari tramite ricompense di esito, essi incontrano una barriera fondamentale legata al supporto del modello di base che può richiedere un numero esponenziale di query, barriera che può essere superata utilizzando ricompense di processo che sfruttano una quantile di verosimiglianza a livello di token per evitare la maledizione della dimensionalità.

Alireza Mousavi-Hosseini, Murat A. ErdogduTue, 10 Ma🤖 cs.LG