FedDAG: Clustered Federated Learning via Global Data and Gradient Integration for Heterogeneous Environments

Il paper presenta FedDAG, un framework di Federated Learning clusterizzato che supera i limiti degli approcci esistenti integrando dati e gradienti per una misurazione più completa della similarità tra client e adottando un'architettura a doppio encoder che permette il trasferimento di caratteristiche tra cluster diversi, ottenendo così prestazioni superiori in ambienti eterogenei.

Anik Pramanik, Murat Kantarcioglu, Vincent Oria + 1 more2026-03-02🤖 cs.LG

Uncovering Physical Drivers of Dark Matter Halo Structures with Auxiliary-Variable-Guided Generative Models

Questo lavoro presenta un modello generativo latente guidato da variabili ausiliarie (DL-CFM) che, applicato alle mappe tSZ degli aloni di materia oscura, disentangla le rappresentazioni latenti in base a massa e concentrazione, trasformando lo spazio latente in uno strumento diagnostico per l'astrofisica cosmologica.

Arkaprabha Ganguli, Anirban Samaddar, Florian Kéruzoré + 4 more2026-03-02📊 stat

Few-Shot Continual Learning for 3D Brain MRI with Frozen Foundation Models

Il documento presenta un approccio di apprendimento continuo few-shot per risonanze magnetiche cerebrali 3D che combina un backbone preaddestrato congelato con moduli LoRA specifici per ogni compito, ottenendo prestazioni bilanciate su segmentazione di tumori e stima dell'età cerebrale senza dimenticare i compiti precedenti e con meno dello 0,1% di parametri addestrabili per task.

Chi-Sheng Chen, Xinyu Zhang, Guan-Ying Chen + 3 more2026-03-02⚡ eess

Dynamics of Learning under User Choice: Overspecialization and Peer-Model Probing

Il paper evidenzia come l'ottimizzazione locale in contesti multi-piattaforma possa intrappolare gli algoritmi in un ciclo di overspecializzazione che compromette le prestazioni globali, proponendo e validando sperimentalmente un metodo di "sondaggio" tra modelli peer per recuperare dati su utenti non selezionati e garantire una convergenza verso soluzioni ottimali per l'intera popolazione.

Adhyyan Narang, Sarah Dean, Lillian J Ratliff + 1 more2026-03-02🤖 cs.LG

Tensor Hypercontraction Error Correction Using Regression

Questo lavoro dimostra che l'uso di modelli di regressione non lineare per correggere gli errori introdotti dalla contrazione iper-tensoriale (THC) nei calcoli di teoria di Møller-Plesset del terzo ordine (MP3) riduce significativamente l'errore quadratico medio rispetto ai valori di riferimento canonici, migliorando l'accuratezza sia per le energie molecolari totali che per quelle di reazione.

Ishna Satyarth, Eric C. Larson, Devin A. Matthews2026-03-02🤖 cs.LG