A Multi-Objective Evaluation Framework for Analyzing Utility-Fairness Trade-Offs in Machine Learning Systems

Questo lavoro presenta un nuovo framework di valutazione multi-obiettivo, disponibile pubblicamente e applicabile in modo agnostico al modello, che facilita l'analisi sistematica dei compromessi tra utilità e equità nei sistemi di Machine Learning, con una specifica validazione empirica nel dominio dell'imaging medico.

Gökhan Özbulak, Oscar Jimenez-del-Toro, Maíra Fatoretto + 2 more2026-03-03🤖 cs.LG

A Benchmark Dataset for Machine Learning Surrogates of Pore-Scale CO2-Water Interaction

Questo lavoro presenta un dataset di riferimento composto da 624 campioni 2D ad alta risoluzione, generati tramite simulazioni numeriche fedeli, che catturano le complesse interazioni tra CO₂ e acqua nei mezzi porosi per supportare lo sviluppo e la validazione di modelli di apprendimento automatico applicati allo stoccaggio geologico del carbonio.

Alhasan Abdellatif, Hannah P. Menke, Julien Maes + 2 more2026-03-03🤖 cs.LG

AdaRank: Adaptive Rank Pruning for Enhanced Model Merging

Il paper propone AdaRank, un nuovo framework di fusione di modelli che migliora l'efficienza e le prestazioni nel multi-task learning selezionando adattivamente le direzioni singolari più utili e rimuovendo dinamicamente quelle interferenti tramite minimizzazione dell'entropia, ottenendo risultati all'avanguardia con un divario prestazionale quasi nullo rispetto ai modelli fine-tuned.

Chanhyuk Lee, Jiho Choi, Chanryeol Lee + 2 more2026-03-03🤖 cs.AI

Geometric Reasoning in the Embedding Space

Questo studio dimostra che le reti neurali su grafi e i transformer possono apprendere a ragionare su vincoli geometrici per prevedere posizioni spaziali, organizzando le loro rappresentazioni in uno spazio di embedding bidimensionale che riflette la struttura della griglia, con le reti neurali su grafi che mostrano prestazioni superiori e una migliore scalabilità rispetto ai transformer.

Jan Hůla, David Mojžíšek, Jiří Janeček + 2 more2026-03-03🤖 cs.LG

Optimistic Online Learning in Symmetric Cone Games

Il paper introduce i giochi su coni simmetrici come quadro unificante per diverse classi di giochi e problemi di ottimizzazione, proponendo l'algoritmo OSCMWU che, grazie alla dimostrazione della forte convessità dell'entropia negativa sui coni simmetrici, calcola efficientemente equilibri di Nash approssimati con complessità iterativa O~(1/ϵ)\tilde{\mathcal{O}}(1/\epsilon).

Anas Barakat, Wayne Lin, John Lazarsfeld + 1 more2026-03-03🔢 math

Standardization of Weighted Ranking Correlation Coefficients

Il paper propone una funzione di standardizzazione generale che trasforma i coefficienti di correlazione tra ranking ponderati, garantendo un valore atteso nullo sotto l'ipotesi di indipendenza e preservando l'intervallo [1,1][-1,1], e fornisce stime numeriche accurate dei parametri distributivi necessari per tale trasformazione tramite campionamento Monte Carlo e regressione polinomiale.

Pierangelo Lombardo2026-03-03🔬 cond-mat

Diffusion Recommender Models and the Illusion of Progress: A Concerning Study of Reproducibility and a Conceptual Mismatch

Questo studio evidenzia come i recenti modelli di raccomandazione basati sulla diffusione, nonostante la loro complessità computazionale, siano sistematicamente inferiori a modelli più semplici a causa di problemi metodologici ricorrenti e di un disallineamento concettuale con il compito di raccomandazione top-n, rivelando un'illusione di progresso che richiede un cambiamento radicale nella cultura della ricerca.

Michael Benigni, Maurizio Ferrari Dacrema, Dietmar Jannach2026-03-03🤖 cs.LG

ARCANE -- Early Detection of Interplanetary Coronal Mass Ejections

Il paper presenta ARCANE, il primo framework progettato per il rilevamento precoce delle espulsioni di massa coronale interplanetarie (ICME) nei dati del vento solare in streaming, che dimostra come il modello ResUNet++ superi le baselines tradizionali mantenendo prestazioni elevate anche con dati in tempo reale e rilevando gli eventi prima del loro completamento.

H. T. Rüdisser, G. Nguyen, J. Le Louëdec + 2 more2026-03-03🔭 astro-ph

DRA-GRPO: Your GRPO Needs to Know Diverse Reasoning Paths for Mathematical Reasoning

Il paper presenta DRA-GRPO, un framework che migliora il ragionamento matematico dei modelli linguistici integrando una calibrazione della diversità basata sull'informazione mutua sottomodulare nel processo di ottimizzazione GRPO, permettendo così di superare la limitazione delle ricompense scalari standard e ottenere prestazioni superiori con dati di addestramento ridotti.

Xiwen Chen, Wenhui Zhu, Peijie Qiu + 7 more2026-03-03💬 cs.CL

Addition is almost all you need: Compressing large language models with double binary factorization

Questo articolo presenta la Double Binary Factorization (DBF), un metodo innovativo che comprime i grandi modelli linguistici fattorizzando le matrici dei pesi in prodotti di due matrici binarie con vettori di scala, offrendo un elevato rapporto di compressione e un controllo fine-granulare della precisione senza compromettere significativamente l'accuratezza.

Vladimír Boža, Vladimír Macko2026-03-03🤖 cs.LG

Back to Square Roots: An Optimal Bound on the Matrix Factorization Error for Multi-Epoch Differentially Private SGD

Questo lavoro introduce il metodo di fattorizzazione BISR (Banded Inverse Square Root), che colma il divario teorico esistente fornendo un limite asintoticamente ottimale per l'errore di fattorizzazione matriciale nell'SGD differenzialmente privato multi-epoca, garantendo al contempo semplicità implementativa ed efficienza computazionale.

Nikita P. Kalinin, Ryan McKenna, Jalaj Upadhyay + 1 more2026-03-03🤖 cs.LG