Implicit Bias of Per-sample Adam on Separable Data: Departure from the Full-batch Regime

Questo lavoro dimostra che l'implicit bias dell'ottimizzatore Adam su dati separabili dipende criticamente dal regime di batch e dal dataset, potendo convergere verso un classificatore a margine massimo 2\ell_2 in modalità incrementale a differenza della tendenza \ell_\infty del full-batch, mentre l'algoritmo Signum mantiene un bias invariato verso \ell_\infty indipendentemente dalla dimensione del batch.

Beomhan Baek, Minhak Song, Chulhee Yun2026-03-05🤖 cs.AI

CNFP: Optimizing Cloud-Native Network Function Placement with Diffusion Models on the Cloud Continuum

Questo studio propone il framework CNFP, che utilizza modelli di diffusione probabilistici basati su reti neurali grafiche per ottimizzare il posizionamento delle funzioni di rete cloud-native nel continuum cloud, superando i limiti di scalabilità e generalizzazione degli approcci tradizionali attraverso la generazione rapida di soluzioni fattibili.

Álvaro Vázquez Rodríguez, Manuel Fernández-Veiga, Carlos Giraldo-Rodríguez2026-03-05🤖 cs.LG

Better audio representations are more brain-like: linking model-brain alignment with performance in downstream auditory tasks

Lo studio dimostra che i modelli audio auto-supervisionati ad alte prestazioni sviluppano rappresentazioni interne più simili all'attività cerebrale, rivelando una forte correlazione positiva tra l'accuratezza nei compiti uditivi e l'allineamento con la corteccia uditiva, suggerendo che tale somiglianza biologica emerga come sottoprodotto dell'apprendimento non supervisionato.

Leonardo Pepino, Pablo Riera, Juan Kamienkowski + 1 more2026-03-05🤖 cs.LG