cs.LG articoli | Gist.Science

BabyHuBERT: Multilingual Self-Supervised Learning for Segmenting Speakers in Child-Centered Long-Form Recordings

Il paper presenta BabyHuBERT, un modello di apprendimento auto-supervisionato multilingue addestrato su 13.000 ore di registrazioni infantili che supera le prestazioni dei modelli esistenti nel distinguere i bambini dagli adulti in registrazioni lunghe e naturali, offrendo risorse preziose per lo studio dello sviluppo linguistico in oltre 40 lingue.

Théo Charlot, Tarek Kunze, Maxime Poli + 3 more2026-03-06💻 cs

Diffusion-Based Impedance Learning for Contact-Rich Manipulation Tasks

Il paper presenta un framework di apprendimento basato su modelli di diffusione che combina la generazione di traiettorie di equilibrio con il controllo di impedenza per abilitare manipolazioni robotiche robuste e adattive in ambienti ricchi di contatti, dimostrando successo in compiti complessi come l'inserimento di perni in fori di geometrie diverse.

Noah Geiger, Tamim Asfour, Neville Hogan + 1 more2026-03-06💻 cs

Complexity-Regularized Proximal Policy Optimization

Il paper propone CR-PPO, un algoritmo di ottimizzazione della politica che sostituisce la regolarizzazione entropica standard con un termine di complessità auto-regolante, dimostrando una maggiore robustezza nell'ipertuning e prestazioni superiori rispetto ai metodi tradizionali.

Luca Serfilippi, Giorgio Franceschelli, Antonio Corradi + 1 more2026-03-06💻 cs

Noise-to-Notes: Diffusion-based Generation and Refinement for Automatic Drum Transcription

Il paper introduce Noise-to-Notes (N2N), un nuovo framework basato su modelli di diffusione che riformula la trascrizione automatica della batteria come un compito generativo, ottenendo prestazioni state-of-the-art grazie all'uso di una nuova funzione di perdita e all'integrazione di feature semantiche da modelli musicali fondamentali.

Michael Yeung, Keisuke Toyama, Toya Teramoto + 2 more2026-03-06💻 cs

BridgeDrive: Diffusion Bridge Policy for Closed-Loop Trajectory Planning in Autonomous Driving

Il paper presenta BridgeDrive, una nuova politica di pianificazione basata su un ponte di diffusione guidato da ancoraggi che garantisce coerenza teorica e prestazioni all'avanguardia nella guida autonoma a ciclo chiuso trasformando traiettorie grezze in piani contestuali in tempo reale.

Shu Liu, Wenlin Chen, Weihao Li + 7 more2026-03-06💻 cs

Towards Understanding Subliminal Learning: When and How Hidden Biases Transfer

Questo studio dimostra che l'apprendimento subliminale, ovvero il trasferimento di bias nascosti dai modelli insegnanti a quelli studenti durante la distillazione, non dipende dalla fuoriuscita di informazioni logit ma da un piccolo insieme di token di divergenza critici nei primi livelli del modello, la cui rimozione o modifica rende il fenomeno fragile e facilmente sopprimibile.

Simon Schrodi, Elias Kempf, Fazl Barez + 1 more2026-03-06💻 cs

BeyondBench: Contamination-Resistant Evaluation of Reasoning in Language Models

Il paper introduce BeyondBench, un framework di valutazione resistente alla contaminazione che utilizza la generazione algoritmica dinamica di problemi matematici per testare in modo affidabile le capacità di ragionamento di oltre 100 modelli linguistici, rivelando significative carenze nelle prestazioni su compiti complessi.

Gaurav Srivastava, Aafiya Hussain, Zhenyu Bi + 5 more2026-03-06💻 cs

Hyperspherical Latents Improve Continuous-Token Autoregressive Generation

Il paper introduce SphereAR, un modello autoregressivo che vincola i latenti su un'ipersfera per stabilizzare la generazione di immagini e raggiungere prestazioni superiori rispetto ai modelli di diffusione e a quelli mascherati, stabilendo un nuovo stato dell'arte per la generazione autoregressiva pura.

Guolin Ke, Hui Xue2026-03-06💻 cs

Quantitative convergence of trained single layer neural networks to Gaussian processes

Questo lavoro fornisce limiti superiori espliciti sulla distanza di Wasserstein quadratica che quantificano la convergenza polinomiale delle reti neurali a strato singolo addestrate tramite discesa del gradiente verso i processi gaussiani nel limite di larghezza infinita.

Eloy Mosig, Andrea Agazzi, Dario Trevisan2026-03-06🔢 math

Pretraining Large Language Models with NVFP4

Questo studio introduce un metodo innovativo per l'addestramento stabile ed efficiente di grandi modelli linguistici in formato NVFP4, combinando trasformate di Hadamard casuali, quantizzazione bidimensionale e arrotondamento stocastico, che permette di addestrare un modello da 12 miliardi di parametri su 10 trilioni di token con prestazioni comparabili alla base FP8.

NVIDIA, Felix Abecassis, Anjulie Agrusa + 87 more2026-03-06💻 cs

OPPO: Accelerating PPO-based RLHF via Pipeline Overlap

Il paper presenta OPPO, un framework leggero e agnostico rispetto al modello che accelera l'addestramento RLHF basato su PPO fino a 2,8 volte migliorando l'utilizzo della GPU attraverso tecniche di sovrapposizione intra-step e inter-step per mitigare le dipendenze sequenziali e la latenza delle risposte lunghe.

Kaizhuo Yan, Yingjie Yu, Yifan Yu + 2 more2026-03-06💻 cs

VidGuard-R1: AI-Generated Video Detection and Explanation via Reasoning MLLMs and RL

Il paper introduce VidGuard-R1, il primo rilevatore di video generati da IA che utilizza l'ottimizzazione della politica relativa di gruppo (GRPO) e modelli di ricompensa specializzati per superare i limiti dei dataset statici, offrendo prestazioni state-of-the-art e spiegazioni forensi basate sul ragionamento.

Kyoungjun Park, Yifan Yang, Juheon Yi + 6 more2026-03-06💻 cs

Non-Asymptotic Analysis of Efficiency in Conformalized Regression

Questo lavoro stabilisce nuovi limiti non asintotici sull'efficienza della regressione conformalizzata addestrata con SGD, quantificando come la lunghezza degli intervalli di previsione dipenda congiuntamente dalla dimensione dei set di dati e dal livello di copertura, e identificando transizioni di fase nei tassi di convergenza.

Yunzhen Yao, Lie He, Michael Gastpar2026-03-06💻 cs

Do We Really Need Permutations? Impact of Model Width on Linear Mode Connectivity

Questo lavoro dimostra empiricamente che, utilizzando una corretta calibrazione della temperatura softmax, l'espansione della larghezza del modello è sufficiente a garantire la connettività lineare delle modalità senza necessità di permutazioni dei parametri, un fenomeno spiegato attraverso l'analisi della somma pesata esponenzialmente degli output dei livelli intermedi.

Akira Ito, Masanori Yamada, Daiki Chijiwa + 1 more2026-03-06💻 cs

True Self-Supervised Novel View Synthesis is Transferable

Il paper presenta XFactor, il primo modello auto-supervisionato senza geometria in grado di sintetizzare nuove visuali con vera trasferibilità, dimostrando che è possibile disaccoppiare la posa della telecamera dal contenuto della scena e ottenere risultati superiori rispetto ai metodi precedenti senza utilizzare induttivi 3D o concetti di geometria multi-vista.

Thomas W. Mitchel, Hyunwoo Ryu, Vincent Sitzmann2026-03-06💻 cs

CBF-RL: Safety Filtering Reinforcement Learning in Training with Control Barrier Functions

Il paper propone CBF-RL, un framework che integra le Funzioni di Barriera di Controllo (CBF) direttamente nell'addestramento del Reinforcement Learning per internalizzare i vincoli di sicurezza nella politica appresa, permettendo così un dispiegamento sicuro e robusto su robot reali senza la necessità di filtri di sicurezza in tempo reale.

Lizhi Yang, Blake Werner, Massimiliano de Sa + 1 more2026-03-06💻 cs

Bayesian Inference for PDE-based Inverse Problems using the Optimization of a Discrete Loss

Questo lavoro introduce B-ODIL, un'estensione bayesiana del metodo di ottimizzazione della perdita discreta (ODIL) per problemi inversi basati su equazioni differenziali alle derivate parziali, che integra modelli fisici e dati osservati per inferire soluzioni con incertezze quantificate, come dimostrato in benchmark sintetici e nell'applicazione clinica alla stima della concentrazione tumorale nel cervello.

Lucas Amoudruz, Sergey Litvinov, Costas Papadimitriou + 1 more2026-03-06🔬 physics

Schrödinger Bridge Mamba for One-Step Speech Enhancement

Il paper presenta Schrödinger Bridge Mamba (SBM), un modello innovativo che combina il paradigma di addestramento Schrödinger Bridge con l'architettura Mamba per ottenere un potenziamento della voce di alta qualità in un solo passo di inferenza, superando i metodi esistenti nel denoising e nella dereverberazione.

Jing Yang, Sirui Wang, Chao Wu + 2 more2026-03-06💻 cs

Breaking and Fixing Defenses Against Control-Flow Hijacking in Multi-Agent Systems

Questo articolo dimostra che le attuali difese contro l'hijacking del flusso di controllo nei sistemi multi-agente sono vulnerabili a causa di conflitti intrinseci tra sicurezza e funzionalità, proponendo quindi ControlValve, un nuovo meccanismo di difesa che garantisce l'integrità del flusso di controllo attraverso la generazione e l'applicazione di grafi di esecuzione autorizzati.

Rishi Jha, Harold Triedman, Justin Wagle, Vitaly Shmatikov2026-03-06🔒 cs.CR

Generalization Below the Edge of Stability: The Role of Data Geometry

Questo articolo teorico dimostra come la geometria dei dati influenzi la generalizzazione nelle reti neurali sovrapparametrizzate al di sotto del limite di stabilità, rivelando che distribuzioni difficili da "frantumare" favoriscono l'apprendimento di pattern condivisi, mentre dati facilmente frantumabili portano alla memorizzazione.

Tongtong Liang, Alexander Cloninger, Rahul Parhi + 1 more2026-03-06💻 cs

← Precedente Successivo →