cs.LG articoli | Gist.Science

Better audio representations are more brain-like: linking model-brain alignment with performance in downstream auditory tasks

Lo studio dimostra che i modelli audio auto-supervisionati ad alte prestazioni sviluppano rappresentazioni interne più simili all'attività cerebrale, rivelando una forte correlazione positiva tra l'accuratezza nei compiti uditivi e l'allineamento con la corteccia uditiva, suggerendo che tale somiglianza biologica emerga come sottoprodotto dell'apprendimento non supervisionato.

Leonardo Pepino, Pablo Riera, Juan Kamienkowski + 1 more2026-03-05🤖 cs.LG

EnECG: Efficient Ensemble Learning for Electrocardiogram Multi-task Foundation Model

Il paper propone EnECG, un framework di apprendimento ensemble basato su un Mixture of Experts che integra modelli fondazione specializzati con un'adattazione LoRA leggera per migliorare l'efficienza computazionale e le prestazioni nell'analisi multi-task dell'elettrocardiogramma.

Yuhao Xu, Xiaoda Wang, Jiaying Lu + 6 more2026-03-05🤖 cs.AI

Soft Quality-Diversity Optimization

Questo paper introduce il "Soft QD", un nuovo approccio alla diversità-qualità che elimina la necessità di discretizzazione dello spazio comportamentale, permettendo di sviluppare l'algoritmo differenziabile SQUAD, il quale dimostra una scalabilità superiore rispetto ai metodi attuali in spazi ad alta dimensionalità.

Saeed Hedayatian, Stefanos Nikolaidis2026-03-05🤖 cs.LG

Weight Space Representation Learning via Neural Field Adaptation

Questo lavoro dimostra che i pesi di adattamento LoRA moltiplicativi, vincolati da un modello di base pre-addestrato, costituiscono rappresentazioni efficaci e semanticamente strutturate nello spazio dei pesi che migliorano la generazione e l'analisi di dati 2D e 3D rispetto ai metodi esistenti.

Zhuoqian Yang, Mathieu Salzmann, Sabine Süsstrunk2026-03-05🤖 cs.AI

ceLLMate: Sandboxing Browser AI Agents

Il paper presenta ceLLMate, un framework di sandboxing a livello browser che mitiga gli attacchi di iniezione prompt negli agenti AI navigando tramite il layer HTTP per colmare il divario semantico tra le interfacce utente e le politiche di sicurezza, riducendo al contempo i rischi senza compromettere significativamente le prestazioni.

Luoxi Meng, Henry Feng, Ilia Shumailov + 1 more2026-03-05🤖 cs.LG

NRR-Core: Non-Resolution Reasoning as a Computational Framework for Contextual Identity and Ambiguity Preservation

Il paper propone NRR-Core, un nuovo quadro computazionale che sfida l'architettura attuale dell'IA trattando la ritenzione dell'ambiguità come una modalità di ragionamento valida attraverso principi di non-identità e tracciamento contestuale, evitando così il collasso semantico prematuro.

Kei Saito2026-03-05🤖 cs.AI

Learning under Distributional Drift: Prequential Reproducibility as an Intrinsic Statistical Resource

Questo lavoro introduce un budget di deriva intrinseco basato sulla distanza di Fisher-Rao per caratterizzare l'apprendimento statistico in ambienti a ciclo chiuso, dimostrando che la riproducibilità prequenziale è limitata da un errore irriducibile proporzionale al tasso medio di deriva cumulativa.

Sofiya Zaichyk2026-03-05🤖 cs.LG

BumpNet: A Sparse MLP Framework for Learning PDE Solutions

Il documento presenta BumpNet, un framework di reti MLP sparse basato su funzioni di base sigmoidali completamente addestrabili e potate per la risoluzione efficiente e universale di equazioni differenziali parziali e l'apprendimento di operatori, integrato in architetture come PINN, EDNN e DeepONet.

Shao-Ting Chiu, Ioannis G. Kevrekidis, Ulisses Braga-Neto2026-03-05🤖 cs.LG

Online Robust Reinforcement Learning with General Function Approximation

Questo lavoro propone un algoritmo di apprendimento per rinforzo robusto completamente online con approssimazione funzionale generale che, attraverso interazione diretta e senza dati preesistenti, garantisce prestazioni ottimali in scenari avversi con complessità sublineare indipendente dalle dimensioni degli spazi di stato e azione.

Debamita Ghosh, George K. Atia, Yue Wang2026-03-05🤖 cs.LG

OASI: Objective-Aware Surrogate Initialization for Multi-Objective Bayesian Optimization in TinyML Keyword Spotting

Il paper propone OASI, un metodo di inizializzazione per l'ottimizzazione bayesiana multi-obiettivo che utilizza soluzioni generate tramite ricottura simulata per migliorare l'efficienza e la robustezza nella progettazione di modelli di keyword spotting per TinyML, garantendo il rispetto dei vincoli di memoria su microcontrollori.

Soumen Garai, Danilo Pau, Suman Samui2026-03-05🤖 cs.LG

Generalization of RLVR Using Causal Reasoning as a Testbed

Questo studio dimostra che il Reinforcement Learning con ricompense verificabili (RLVR) migliora la generalizzazione nel ragionamento causale rispetto al fine-tuning supervisionato, ma solo quando applicato a modelli con competenza iniziale sufficiente, ottimizzando strategie di marginalizzazione e riducendo errori nei calcoli probabilistici intermedi.

Brian Lu, Hongyu Zhao, Shuo Sun + 3 more2026-03-05🤖 cs.AI

Deterministic Coreset for Lp Subspace

Questo lavoro presenta il primo algoritmo iterativo deterministico per costruire un coreset di dimensione ottimale $O\left(\frac{d^{\max\{1,p/2\}}}{\varepsilon^{2}}\right)$ che garantisce un embedding deterministico del sottospazio $\ell_p$ per qualsiasi $p \in [1,\infty)$ , risolvendo un problema aperto di lunga data eliminando i fattori logaritmici e permettendo la risoluzione deterministica del problema di regressione $\ell_p$ .

Rachit Chhaya, Anirban Dasgupta, Dan Feldman + 1 more2026-03-05🤖 cs.LG

Succeeding at Scale: Automated Dataset Construction and Query-Side Adaptation for Multi-Tenant Search

Il paper introduce DevRev-Search, un benchmark e una strategia di adattamento che preservano l'indice, permettendo di sfruttare i dati "oscuri" dei sistemi di ricerca multi-tenant tramite un processo automatizzato di costruzione del dataset e il fine-tuning efficiente solo dell'encoder delle query.

Prateek Jain, Shabari S Nair, Ritesh Goru + 4 more2026-03-05🤖 cs.AI

Measurement-Consistent Langevin Corrector for Stabilizing Latent Diffusion Inverse Problem Solvers

Questo lavoro introduce il *Measurement-Consistent Langevin Corrector* (MCLC), un modulo teorico e plug-and-play che stabilizza i risolutori di problemi inversi basati su modelli di diffusione latente riducendo la discrepanza tra le dinamiche del solver e quelle apprese dal modello, garantendo così un comportamento più affidabile nello spazio latente senza fare affidamento su assunzioni di varietà lineare.

Lee Hyoseok, Sohwi Lim, Eunju Cha + 1 more2026-03-05🤖 cs.LG

Tracing 3D Anatomy in 2D Strokes: A Multi-Stage Projection Driven Approach to Cervical Spine Fracture Identification

Questo studio presenta un pipeline automatizzato end-to-end per l'identificazione delle fratture della colonna cervicale che, combinando rilevamento 2D, segmentazione multi-proiezione e modelli ibridi CNN-Transformer, ricostruisce volumi 3D stimati per ottenere prestazioni diagnostiche comparabili a quelle degli esperti riducendo al contempo la dimensionalità computazionale.

Fabi Nahian Madhurja, Rusab Sarmun, Muhammad E. H. Chowdhury + 3 more2026-03-05🤖 cs.AI

Synthetic Augmentation in Imbalanced Learning: When It Helps, When It Hurts, and How Much to Add

Questo lavoro propone un quadro statistico unificato che dimostra come l'aumento sintetico nei dati sbilanciati non sia sempre vantaggioso, identificando le condizioni in cui può danneggiare le prestazioni e introducendo una strategia pratica (VTSS) per ottimizzare la quantità di campioni sintetici da generare.

Zhengchi Ma, Anru R. Zhang2026-03-05🤖 cs.LG

SpecBridge: Bridging Mass Spectrometry and Molecular Representations via Cross-Modal Alignment

SpecBridge è un nuovo framework di allineamento cross-modale che, affinando un codificatore spettrale pre-addestrato per proiettare gli spettri di massa nello spazio latente di un modello molecolare fondazionale congelato, migliora significativamente l'accuratezza del recupero delle piccole molecole rispetto ai metodi esistenti mantenendo un numero ridotto di parametri addestrabili.

Yinkai Wang, Yan Zhou Chen, Xiaohui Chen + 2 more2026-03-05🤖 cs.LG

LeanTutor: Towards a Verified AI Mathematical Proof Tutor

Il paper presenta LeanTutor, un sistema di tutoraggio per dimostrazioni matematiche che combina le capacità linguistiche dei modelli di grandi dimensioni con la correttezza verificabile del prover Lean, valutato attraverso il nuovo dataset PeanoBench.

Manooshree Patel, Rayna Bhattacharyya, Thomas Lu + 4 more2026-03-05🤖 cs.LG

NRR-Phi: Text-to-State Mapping for Ambiguity Preservation in LLM Inference

Il paper presenta NRR-Phi, un framework formale che mappa il testo in uno stato non collassante per preservare l'ambiguità semantica durante l'inferenza dei modelli linguistici, combinando rilevamento di conflitti ed estrazione di interpretazioni per evitare la prematura convergenza su un'unica risposta.

Kei Saito2026-03-05🤖 cs.AI

No More, No Less: Least-Privilege Language Models

Il documento propone un nuovo paradigma di deployment per i modelli linguistici basato sul principio del privilegio minimo, introducendo le "Nested Least-Privilege Networks" che permettono di controllare e ridurre le capacità computazionali interne del modello durante l'inferenza senza necessità di riaddestramento, garantendo così una maggiore sicurezza e selettività rispetto ai metodi tradizionali di controllo basati solo sull'output.

Paulius Rauba, Dominykas Seputis, Patrikas Vanagas + 1 more2026-03-05🤖 cs.LG

← Precedente Successivo →