cs.LG articoli | Gist.Science

Phase-Type Variational Autoencoders for Heavy-Tailed Data

Il paper propone il PH-VAE, un nuovo modello generativo che integra le distribuzioni di tipo fase nel decoder per catturare in modo flessibile e adattivo le code pesanti e le dipendenze multivariate nei dati reali, superando i limiti degli approcci VAE tradizionali basati su distribuzioni parametriche fisse.

Abdelhakim Ziani, András Horváth, Paolo Ballarini2026-03-03📊 stat

Deep Learning for Financial Time Series: A Large-Scale Benchmark of Risk-Adjusted Performance

Questo studio presenta un ampio benchmark che dimostra come modelli ibridi, in particolare la combinazione di Variable Selection Networks e LSTM, superino le architetture lineari e generiche nel massimizzare il rapporto di Sharpe e nella gestione del rischio su un dataset di futures giornalieri dal 2010 al 2025.

Adir Saly-Kaufmann, Kieran Wood, Jan Peter-Calliess + 1 more2026-03-03💰 q-fin

Uncertainty Quantification of Click and Conversion Estimates for the Autobidding

Il paper propone il metodo DenoiseBid, un approccio bayesiano che corregge le stime incerte di CTR e CVR nei sistemi di autobidding per e-commerce, sostituendo i valori rumorosi con distribuzioni recuperate per migliorare l'efficienza delle aste, come dimostrato da esperimenti su dataset sintetici e reali.

Ivan Zhigalskii, Andrey Pudovikov, Aleksandr Katrutsa + 1 more2026-03-03📊 stat

Probing Materials Knowledge in LLMs: From Latent Embeddings to Reliable Predictions

Lo studio rivela che l'affidabilità dei grandi modelli linguistici nelle scienze dei materiali dipende criticamente dal tipo di output richiesto, mostrando come il fine-tuning migliori la coerenza per i compiti simbolici ma non per quelli numerici, e che l'estrazione diretta degli embedding intermedi può superare i limiti delle risposte testuali, pur evidenziando significative variazioni di prestazioni nel tempo che minacciano la riproducibilità scientifica.

Vineeth Venugopal, Soroush Mahjoubi, Elsa Olivetti2026-03-03🔬 cond-mat.mtrl-sci

Constrained Particle Seeking: Solving Diffusion Inverse Problems with Just Forward Passes

Il paper introduce CPS, un approccio privo di gradienti per risolvere problemi inversi di diffusione che riformula il compito come ottimizzazione vincolata per cercare attivamente particelle ottimali senza richiedere la conoscenza completa del processo di osservazione.

Hongkun Dou, Zike Chen, Zeyu Li + 3 more2026-03-03📊 stat

Accelerating Single-Pass SGD for Generalized Linear Prediction

Questo lavoro risolve un problema aperto proponendo il primo algoritmo che integra l'impulso (momentum) nell'ottimizzazione stocastica a passaggio singolo per la predizione lineare generalizzata, ottenendo un'accelerazione duale e dimostrando la sua superiorità rispetto alla riduzione della varianza.

Qian Chen, Shihong Ding, Cong Fang2026-03-03📊 stat

CoVAE: correlated multimodal generative modeling

Il paper introduce CoVAE, una nuova architettura generativa che cattura le correlazioni tra le modalità nei dati multimodali, superando i limiti delle strategie di fusione nello spazio latente tradizionali per garantire una ricostruzione incrociata accurata e una quantificazione efficace dell'incertezza.

Federico Caretti, Guido Sanguinetti2026-03-03🧬 q-bio

LOCUS: A Distribution-Free Loss-Quantile Score for Risk-Aware Predictions

Il paper introduce Locus, un metodo senza distribuzione che genera un punteggio interpretabile per quantificare il rischio di perdita su base per-input, permettendo di ordinare le previsioni e ridurre la frequenza di errori costosi attraverso una calibrazione semplice e garantita.

Matheus Barreto, Mário de Castro, Thiago R. Ramos + 2 more2026-03-03📊 stat

Quantitative Convergence of Wasserstein Gradient Flows of Kernel Mean Discrepancies

Questo studio stabilisce la convergenza quantitativa dei flussi gradiente di Wasserstein per le discrepanze di media kernel, fornendo nuovi risultati di esistenza, unicità e tassi di convergenza (globali esponenziali per $s=1$ e locali polinomiali per $s>1$ ) che si applicano al training di reti neurali a strato singolo e a sistemi di particelle interagenti, risolvendo questioni aperte sulla convergenza non quantitativa in questi contesti.

Lénaïc Chizat, Maria Colombo, Roberto Colombo + 1 more2026-03-03🔢 math

Noise-Calibrated Inference from Differentially Private Sufficient Statistics in Exponential Families

Questo articolo propone un approccio intermedio per l'inferenza differenzialmente privata nelle famiglie esponenziali che rilascia statistiche sufficienti rumorose per consentire un'analisi statistica calibrata e una generazione di dati sintetici con quantificazione rigorosa dell'incertezza.

Amir Asiaee, Samhita Pal2026-03-03📊 stat

Graph neural network force fields for adiabatic dynamics of lattice Hamiltonians

Questo lavoro dimostra che le reti neurali grafiche (GNN) offrono un'architettura scalabile e simmetrica per simulare la dinamica adiabatrica di Hamiltoniani reticolari, consentendo tramite l'addestramento su dati di diagonalizzazione esatta simulazioni su larga scala che rivelano una crescita anomala dei domini di ordine a onde di densità di carica.

Yunhao Fan, Gia-Wei Chern2026-03-03🔬 cond-mat

Leave-One-Out Prediction for General Hypothesis Classes

Il paper introduce la procedura di aggregazione MLSA per stabilire un'ineguaglianza oracolare moltiplicativa per l'errore di previsione leave-one-out in classi di ipotesi generali, dimostrando che tale errore è limitato da una costante moltiplicata per il rischio empirico minimo più un termine di complessità che scala come $O(d \log n)$ o $O(\log |H|)$ a seconda del contesto.

Jian Qian, Jiachen Xu2026-03-03📊 stat

TRAKNN: Efficient Trajectory Aware Spatiotemporal kNN for Rare Meteorological Trajectory Detection

Il paper presenta TRAKNN, un framework non supervisionato ed efficiente che utilizza un approccio kNN esatto basato sulla ricorrenza per rilevare traiettorie atmosferiche rare e geometricamente significative in grandi dataset spaziotemporali, superando le sfide computazionali tradizionali e identificando con successo anomalie coerenti con eventi meteorologici estremi.

Guillaume Coulaud, Davide Faranda2026-03-03📊 stat

Scaling Laws of SignSGD in Linear Regression: When Does It Outperform SGD?

Questo studio analizza le leggi di scalabilità di signSGD nella regressione lineare, dimostrando che, grazie a effetti unici di normalizzazione della deriva e rimodellamento del rumore, il metodo può superare SGD in termini di pendenza ottimale di calcolo in regimi dominati dal rumore, specialmente quando si utilizza un programma di apprendimento WSD con decadimento rapido delle caratteristiche.

Jihwan Kim, Dogyoon Song, Chulhee Yun2026-03-03📊 stat

Adam Converges Without Any Modification On Update Rules

Questo lavoro dimostra teoricamente che l'ottimizzatore Adam converge senza modifiche alle sue regole di aggiornamento, identificando una transizione di fase dipendente dal problema e dalla dimensione del batch nello spazio dei parametri $(\beta_1, \beta_2)$ e fornendo linee guida pratiche per la loro sintonizzazione che sono state validate empiricamente nel training di modelli linguistici su larga scala.

Yushun Zhang, Bingran Li, Congliang Chen + 2 more2026-03-03🔢 math

Orchestrating Multimodal DNN Workloads in Wireless Neural Processing

Questo articolo propone O-WiN, un framework che ottimizza l'esecuzione end-to-end dei carichi di lavoro DNN multimodali nei sistemi di elaborazione neurale wireless, dimostrando come l'interleaving delle trasmissioni e dell'esecuzione tramite l'algoritmo PACS riduca significativamente la latenza rispetto alla schedulazione sequenziale.

Sai Xu, Kai-Kit Wong, Yanan Du + 1 more2026-03-03⚡ eess

Near-Optimal Regret for KL-Regularized Multi-Armed Bandits

Questo lavoro caratterizza l'efficienza statistica dei bandit multi-braccio regolarizzati con KL fornendo il primo limite superiore di rimpianto con dipendenza lineare da $K$ e un limite inferiore quasi corrispondente, dimostrando così la near-ottimalità dell'algoritmo KL-UCB attraverso tutti i regimi di regolarizzazione.

Kaixuan Ji, Qingyue Zhao, Heyang Zhao + 2 more2026-03-03📊 stat

Instrumental and Proximal Causal Inference with Gaussian Processes

Il paper propone un quadro basato su Processi Gaussiani Decondizionati (DGP) per l'inferenza causale con variabili strumentali e proxy, colmando la lacuna nella quantificazione dell'incertezza epistemica e offrendo una soluzione unificata che garantisce precisione predittiva, selezione del modello e stime di incertezza ben calibrate in presenza di confondimento non osservato.

Yuqi Zhang, Krikamol Muandet, Dino Sejdinovic + 2 more2026-03-03📊 stat

Reservoir Subspace Injection for Online ICA under Top-n Whitening

Questo lavoro propone un controller di iniezione di sottospazio serbatoio (RSI) che, mitigando l'effetto di espulsione delle direzioni di passaggio causato dalla sbiancatura top- $n$ , ripristina le prestazioni dell'analisi delle componenti indipendenti online e ne migliora l'efficacia in scenari di miscelazione non lineare.

Wenjun Xiao, Yuda Bi, Vince D Calhoun2026-03-03📊 stat

Symbol-Equivariant Recurrent Reasoning Models

Il paper introduce i SE-RRM, un modello di ragionamento ricorrente che garantisce l'equivarianza simbolica a livello architetturale, migliorando le prestazioni e la capacità di generalizzazione su problemi come Sudoku e ARC-AGI rispetto ai modelli precedenti, pur utilizzando meno dati e parametri.

Richard Freinschlag, Timo Bertram, Erich Kobler + 2 more2026-03-03📊 stat

← Precedente Successivo →