Geometric Reasoning in the Embedding Space

Questo studio dimostra che le reti neurali su grafi e i transformer possono apprendere a ragionare su vincoli geometrici per prevedere posizioni spaziali, organizzando le loro rappresentazioni in uno spazio di embedding bidimensionale che riflette la struttura della griglia, con le reti neurali su grafi che mostrano prestazioni superiori e una migliore scalabilità rispetto ai transformer.

Jan Hůla, David Mojžíšek, Jiří Janeček + 2 more2026-03-03🤖 cs.LG

Optimistic Online Learning in Symmetric Cone Games

Il paper introduce i giochi su coni simmetrici come quadro unificante per diverse classi di giochi e problemi di ottimizzazione, proponendo l'algoritmo OSCMWU che, grazie alla dimostrazione della forte convessità dell'entropia negativa sui coni simmetrici, calcola efficientemente equilibri di Nash approssimati con complessità iterativa O~(1/ϵ)\tilde{\mathcal{O}}(1/\epsilon).

Anas Barakat, Wayne Lin, John Lazarsfeld + 1 more2026-03-03🔢 math

Standardization of Weighted Ranking Correlation Coefficients

Il paper propone una funzione di standardizzazione generale che trasforma i coefficienti di correlazione tra ranking ponderati, garantendo un valore atteso nullo sotto l'ipotesi di indipendenza e preservando l'intervallo [1,1][-1,1], e fornisce stime numeriche accurate dei parametri distributivi necessari per tale trasformazione tramite campionamento Monte Carlo e regressione polinomiale.

Pierangelo Lombardo2026-03-03🔬 cond-mat

Diffusion Recommender Models and the Illusion of Progress: A Concerning Study of Reproducibility and a Conceptual Mismatch

Questo studio evidenzia come i recenti modelli di raccomandazione basati sulla diffusione, nonostante la loro complessità computazionale, siano sistematicamente inferiori a modelli più semplici a causa di problemi metodologici ricorrenti e di un disallineamento concettuale con il compito di raccomandazione top-n, rivelando un'illusione di progresso che richiede un cambiamento radicale nella cultura della ricerca.

Michael Benigni, Maurizio Ferrari Dacrema, Dietmar Jannach2026-03-03🤖 cs.LG

ARCANE -- Early Detection of Interplanetary Coronal Mass Ejections

Il paper presenta ARCANE, il primo framework progettato per il rilevamento precoce delle espulsioni di massa coronale interplanetarie (ICME) nei dati del vento solare in streaming, che dimostra come il modello ResUNet++ superi le baselines tradizionali mantenendo prestazioni elevate anche con dati in tempo reale e rilevando gli eventi prima del loro completamento.

H. T. Rüdisser, G. Nguyen, J. Le Louëdec + 2 more2026-03-03🔭 astro-ph

DRA-GRPO: Your GRPO Needs to Know Diverse Reasoning Paths for Mathematical Reasoning

Il paper presenta DRA-GRPO, un framework che migliora il ragionamento matematico dei modelli linguistici integrando una calibrazione della diversità basata sull'informazione mutua sottomodulare nel processo di ottimizzazione GRPO, permettendo così di superare la limitazione delle ricompense scalari standard e ottenere prestazioni superiori con dati di addestramento ridotti.

Xiwen Chen, Wenhui Zhu, Peijie Qiu + 7 more2026-03-03💬 cs.CL

Addition is almost all you need: Compressing large language models with double binary factorization

Questo articolo presenta la Double Binary Factorization (DBF), un metodo innovativo che comprime i grandi modelli linguistici fattorizzando le matrici dei pesi in prodotti di due matrici binarie con vettori di scala, offrendo un elevato rapporto di compressione e un controllo fine-granulare della precisione senza compromettere significativamente l'accuratezza.

Vladimír Boža, Vladimír Macko2026-03-03🤖 cs.LG

Back to Square Roots: An Optimal Bound on the Matrix Factorization Error for Multi-Epoch Differentially Private SGD

Questo lavoro introduce il metodo di fattorizzazione BISR (Banded Inverse Square Root), che colma il divario teorico esistente fornendo un limite asintoticamente ottimale per l'errore di fattorizzazione matriciale nell'SGD differenzialmente privato multi-epoca, garantendo al contempo semplicità implementativa ed efficienza computazionale.

Nikita P. Kalinin, Ryan McKenna, Jalaj Upadhyay + 1 more2026-03-03🤖 cs.LG

GradPCA: Leveraging NTK Alignment for Reliable Out-of-Distribution Detection

Il paper introduce GradPCA, un metodo per il rilevamento di dati fuori distribuzione (OOD) che sfrutta la struttura a basso rango dei gradienti delle reti neurali indotta dall'allineamento NTK, applicando l'analisi delle componenti principali (PCA) alle medie dei gradienti per ottenere prestazioni più coerenti e fornendo un quadro teorico che evidenzia il ruolo cruciale della qualità delle feature.

Mariia Seleznova, Hung-Hsu Chou, Claudio Mayrink Verdun + 1 more2026-03-03🤖 cs.LG