Better audio representations are more brain-like: linking model-brain alignment with performance in downstream auditory tasks

Lo studio dimostra che i modelli audio auto-supervisionati ad alte prestazioni sviluppano rappresentazioni interne più simili all'attività cerebrale, rivelando una forte correlazione positiva tra l'accuratezza nei compiti uditivi e l'allineamento con la corteccia uditiva, suggerendo che tale somiglianza biologica emerga come sottoprodotto dell'apprendimento non supervisionato.

Leonardo Pepino, Pablo Riera, Juan Kamienkowski + 1 more2026-03-05🤖 cs.LG

OASI: Objective-Aware Surrogate Initialization for Multi-Objective Bayesian Optimization in TinyML Keyword Spotting

Il paper propone OASI, un metodo di inizializzazione per l'ottimizzazione bayesiana multi-obiettivo che utilizza soluzioni generate tramite ricottura simulata per migliorare l'efficienza e la robustezza nella progettazione di modelli di keyword spotting per TinyML, garantendo il rispetto dei vincoli di memoria su microcontrollori.

Soumen Garai, Danilo Pau, Suman Samui2026-03-05🤖 cs.LG

Deterministic Coreset for Lp Subspace

Questo lavoro presenta il primo algoritmo iterativo deterministico per costruire un coreset di dimensione ottimale O(dmax{1,p/2}ε2)O\left(\frac{d^{\max\{1,p/2\}}}{\varepsilon^{2}}\right) che garantisce un embedding deterministico del sottospazio p\ell_p per qualsiasi p[1,)p \in [1,\infty), risolvendo un problema aperto di lunga data eliminando i fattori logaritmici e permettendo la risoluzione deterministica del problema di regressione p\ell_p.

Rachit Chhaya, Anirban Dasgupta, Dan Feldman + 1 more2026-03-05🤖 cs.LG

Measurement-Consistent Langevin Corrector for Stabilizing Latent Diffusion Inverse Problem Solvers

Questo lavoro introduce il *Measurement-Consistent Langevin Corrector* (MCLC), un modulo teorico e plug-and-play che stabilizza i risolutori di problemi inversi basati su modelli di diffusione latente riducendo la discrepanza tra le dinamiche del solver e quelle apprese dal modello, garantendo così un comportamento più affidabile nello spazio latente senza fare affidamento su assunzioni di varietà lineare.

Lee Hyoseok, Sohwi Lim, Eunju Cha + 1 more2026-03-05🤖 cs.LG

Tracing 3D Anatomy in 2D Strokes: A Multi-Stage Projection Driven Approach to Cervical Spine Fracture Identification

Questo studio presenta un pipeline automatizzato end-to-end per l'identificazione delle fratture della colonna cervicale che, combinando rilevamento 2D, segmentazione multi-proiezione e modelli ibridi CNN-Transformer, ricostruisce volumi 3D stimati per ottenere prestazioni diagnostiche comparabili a quelle degli esperti riducendo al contempo la dimensionalità computazionale.

Fabi Nahian Madhurja, Rusab Sarmun, Muhammad E. H. Chowdhury + 3 more2026-03-05🤖 cs.AI

SpecBridge: Bridging Mass Spectrometry and Molecular Representations via Cross-Modal Alignment

SpecBridge è un nuovo framework di allineamento cross-modale che, affinando un codificatore spettrale pre-addestrato per proiettare gli spettri di massa nello spazio latente di un modello molecolare fondazionale congelato, migliora significativamente l'accuratezza del recupero delle piccole molecole rispetto ai metodi esistenti mantenendo un numero ridotto di parametri addestrabili.

Yinkai Wang, Yan Zhou Chen, Xiaohui Chen + 2 more2026-03-05🤖 cs.LG

No More, No Less: Least-Privilege Language Models

Il documento propone un nuovo paradigma di deployment per i modelli linguistici basato sul principio del privilegio minimo, introducendo le "Nested Least-Privilege Networks" che permettono di controllare e ridurre le capacità computazionali interne del modello durante l'inferenza senza necessità di riaddestramento, garantendo così una maggiore sicurezza e selettività rispetto ai metodi tradizionali di controllo basati solo sull'output.

Paulius Rauba, Dominykas Seputis, Patrikas Vanagas + 1 more2026-03-05🤖 cs.LG