LAtte: Hyperbolic Lorentz Attention for Cross-Subject EEG Classification

Il paper presenta LAtte, un nuovo framework che combina un modulo di attenzione Lorentz con un encoder InceptionTime per migliorare la classificazione EEG cross-soggetto, superando le limitazioni della variabilità inter-soggetto attraverso l'apprendimento di un segnale di base condiviso e di embedding specifici per ogni individuo.

Johannes Burchert, Ahmad Bdeir, Tom Hanika, Lars Schmidt-Thieme, Niels Landwehr2026-03-12🤖 cs.LG

Continuous Diffusion Transformers for Designing Synthetic Regulatory Elements

Il paper presenta un Diffusion Transformer (DiT) efficiente in termini di parametri, dotato di un codificatore CNN 2D e ottimizzato tramite DDPO con Enformer, in grado di generare sequenze di DNA regolatorio sintetico specifiche per il tipo cellulare con una convergenza più rapida, una minore memorizzazione dei dati e un'attività regolatoria predetta significativamente superiore rispetto ai modelli precedenti.

Jonathan Liu, Kia Ghods2026-03-12🧬 q-bio

Dynamics-Predictive Sampling for Active RL Finetuning of Large Reasoning Models

Il lavoro propone il campionamento predittivo dinamico (DPS), un metodo che accelera il fine-tuning con apprendimento per rinforzo dei grandi modelli di ragionamento prevedendo online la dinamica di apprendimento dei prompt tramite inferenza bayesiana, riducendo così i costosi rollouts e migliorando le prestazioni senza compromettere l'efficienza.

Yixiu Mao, Yun Qu, Qi Wang, Heming Zou, Xiangyang Ji2026-03-12🤖 cs.LG

LookaheadKV: Fast and Accurate KV Cache Eviction by Glimpsing into the Future without Generation

LookaheadKV è un framework di evizione della cache KV leggero e preciso che, evitando la costosa generazione di bozze, utilizza moduli efficienti per prevedere l'importanza futura dei token, garantendo prestazioni superiori e una riduzione dei costi di evizione fino a 14,5 volte rispetto ai metodi esistenti.

Jinwoo Ahn, Ingyu Seong, Akhil Kedia, Junhan Kim, Hyemi Jang, Kangwook Lee, Yongkweon Jeon2026-03-12🤖 cs.LG

ECoLAD: Deployment-Oriented Evaluation for Automotive Time-Series Anomaly Detection

Il paper presenta ECoLAD, un protocollo di valutazione orientato al deployment per la rilevazione di anomalie nelle serie temporali automobilistiche che, a differenza delle classifiche basate solo sull'accuratezza, valuta le prestazioni sotto vincoli computazionali reali, dimostrando come i metodi classici leggeri mantengano la fattibilità dove i modelli profondi falliscono.

Kadir-Kaan Özer, René Ebeling, Markus Enzweiler2026-03-12🤖 cs.LG

Safe RLHF Beyond Expectation: Stochastic Dominance for Universal Spectral Risk Control

Il paper propone RAD, un nuovo framework di allineamento per l'apprendimento per rinforzo sicuro che sostituisce i vincoli di costo atteso con vincoli di dominanza stocastica di primo ordine, permettendo un controllo universale dei rischi di coda e delle prestazioni su distribuzioni fuori dal dominio attraverso un'ottimizzazione differenziabile basata sul trasporto ottimo.

Yaswanth Chittepu, Ativ Joshi, Rajarshi Bhattacharjee, Scott Niekum2026-03-12🤖 cs.LG

When should we trust the annotation? Selective prediction for molecular structure retrieval from mass spectra

Questo articolo introduce un framework di previsione selettiva per il recupero di strutture molecolari dagli spettri di massa, dimostrando che l'uso di misure di incertezza a livello di recupero e di controllo del rischio senza distribuzione permette di ottenere annotazioni affidabili con un tasso di errore controllato, evitando così previsioni in contesti ad alto rischio.

Mira Jürgens, Gaetan De Waele, Morteza Rakhshaninejad, Willem Waegeman2026-03-12📊 stat

FRIEND: Federated Learning for Joint Optimization of multi-RIS Configuration and Eavesdropper Intelligent Detection in B5G Networks

Questo articolo presenta un framework federato che ottimizza congiuntamente la configurazione di più superfici intelligenti riconfigurabili (RIS) e il rilevamento di intercettazioni nelle reti B5G, migliorando significativamente il tasso di segretezza e garantendo la privacy dei dati nelle comunicazioni industriali.

Maria Lamprini A. Bartsioka, Ioannis A. Bartsiokas, Anastasios K. Papazafeiropoulos, Maria A. Seimeni, Dimitra I. Kaklamani, Iakovos S. Venieris2026-03-12🤖 cs.LG

Federated Learning-driven Beam Management in LEO 6G Non-Terrestrial Networks

Questo studio dimostra che l'uso di una Rete Neurale Grafica (GNN) nell'ambito dell'Apprendimento Federato per la gestione dei fasci nelle costellazioni satellitari LEO supera le prestazioni dei modelli MLP, garantendo una selezione dei fasci più accurata e stabile, specialmente a bassi angoli di elevazione.

Maria Lamprini Bartsioka, Ioannis A. Bartsiokas, Athanasios D. Panagopoulos, Dimitra I. Kaklamani, Iakovos S. Venieris2026-03-12🔬 physics

The Discrete Charm of the MLP: Binary Routing of Continuous Signals in Transformer Feed-Forward Layers

Questo studio dimostra che i livelli MLP nei transformer eseguono un instradamento binario di segnali continui, dove specifici neuroni agiscono come interruttori che decidono quali token necessitano di elaborazione non lineare, rivelando un'architettura di consenso ed eccezione che evolve attraverso i livelli e che non può essere adeguatamente approssimata da funzioni polinomiali lisce.

Peter Balogh2026-03-12🤖 cs.LG