cs.LG articoli | Gist.Science

SNPgen: Phenotype-Supervised Genotype Representation and Synthetic Data Generation via Latent Diffusion

Il paper presenta SNPgen, un framework di diffusione latente condizionato che genera dati genetici sintetici supervisionati dal fenotipo, preservando la privacy e mantenendo un'alta fedeltà statistica e utilità predittiva per l'analisi delle malattie complesse.

Andrea Lampis, Michela Carlotta Massi, Nicola Pirastu, Francesca Ieva, Matteo Matteucci, Emanuele Di Angelantonio2026-03-12🧬 q-bio

LAtte: Hyperbolic Lorentz Attention for Cross-Subject EEG Classification

Il paper presenta LAtte, un nuovo framework che combina un modulo di attenzione Lorentz con un encoder InceptionTime per migliorare la classificazione EEG cross-soggetto, superando le limitazioni della variabilità inter-soggetto attraverso l'apprendimento di un segnale di base condiviso e di embedding specifici per ogni individuo.

Johannes Burchert, Ahmad Bdeir, Tom Hanika, Lars Schmidt-Thieme, Niels Landwehr2026-03-12🤖 cs.LG

Continuous Diffusion Transformers for Designing Synthetic Regulatory Elements

Il paper presenta un Diffusion Transformer (DiT) efficiente in termini di parametri, dotato di un codificatore CNN 2D e ottimizzato tramite DDPO con Enformer, in grado di generare sequenze di DNA regolatorio sintetico specifiche per il tipo cellulare con una convergenza più rapida, una minore memorizzazione dei dati e un'attività regolatoria predetta significativamente superiore rispetto ai modelli precedenti.

Jonathan Liu, Kia Ghods2026-03-12🧬 q-bio

Kernel Tests of Equivalence

Il paper propone nuovi test basati su kernel, utilizzando la discrepanza di Stein e la discrepanza massima media, per valutare l'equivalenza tra distribuzioni e superare i limiti dei test di bontà di adattamento tradizionali che non possono confermare l'assenza di differenze significative.

Xing Liu, Axel Gandy2026-03-12📊 stat

Dynamics-Predictive Sampling for Active RL Finetuning of Large Reasoning Models

Il lavoro propone il campionamento predittivo dinamico (DPS), un metodo che accelera il fine-tuning con apprendimento per rinforzo dei grandi modelli di ragionamento prevedendo online la dinamica di apprendimento dei prompt tramite inferenza bayesiana, riducendo così i costosi rollouts e migliorando le prestazioni senza compromettere l'efficienza.

Yixiu Mao, Yun Qu, Qi Wang, Heming Zou, Xiangyang Ji2026-03-12🤖 cs.LG

Ergodicity in reinforcement learning

Questo articolo esamina l'impatto dei processi di ricompensa non ergodici nell'apprendimento per rinforzo, spiegando perché l'ottimizzazione del valore atteso sia inadeguata per le prestazioni individuali e presentando soluzioni per massimizzare i risultati a lungo termine di singole traiettorie.

Dominik Baumann, Erfaun Noorani, Arsenii Mustafin, Xinyi Sheng, Bert Verbruggen, Arne Vanhoyweghen, Vincent Ginis, Thomas B. Schön2026-03-12🤖 cs.LG

LookaheadKV: Fast and Accurate KV Cache Eviction by Glimpsing into the Future without Generation

LookaheadKV è un framework di evizione della cache KV leggero e preciso che, evitando la costosa generazione di bozze, utilizza moduli efficienti per prevedere l'importanza futura dei token, garantendo prestazioni superiori e una riduzione dei costi di evizione fino a 14,5 volte rispetto ai metodi esistenti.

Jinwoo Ahn, Ingyu Seong, Akhil Kedia, Junhan Kim, Hyemi Jang, Kangwook Lee, Yongkweon Jeon2026-03-12🤖 cs.LG

NCAA Bracket Prediction Using Machine Learning and Combinatorial Fusion Analysis

Questo articolo presenta un nuovo approccio per la previsione dei risultati del torneo NCAA 2024 basato sull'Analisi di Fusione Combinatoria (CFA), che combina diversi sistemi di punteggio per ottenere un'accuratezza del 74,60%, superando così le migliori dieci classifiche pubbliche esistenti.

Yuanhong Wu, Isaiah Smith, Tushar Marwah, Michael Schroeter, Mohamed Rahouti, D. Frank Hsu2026-03-12🤖 cs.LG

ECoLAD: Deployment-Oriented Evaluation for Automotive Time-Series Anomaly Detection

Il paper presenta ECoLAD, un protocollo di valutazione orientato al deployment per la rilevazione di anomalie nelle serie temporali automobilistiche che, a differenza delle classifiche basate solo sull'accuratezza, valuta le prestazioni sotto vincoli computazionali reali, dimostrando come i metodi classici leggeri mantengano la fattibilità dove i modelli profondi falliscono.

Kadir-Kaan Özer, René Ebeling, Markus Enzweiler2026-03-12🤖 cs.LG

Historical Consensus: Preventing Posterior Collapse via Iterative Selection of Gaussian Mixture Priors

Questo paper introduce il "Historical Consensus Training", un metodo iterativo che seleziona prior a miscela gaussiana per eliminare definitivamente il collasso posteriore nei VAE, garantendo rappresentazioni informative senza richiedere condizioni di stabilità esplicite o vincoli architetturali.

Zegu Zhang, Jian Zhang2026-03-12🤖 cs.LG

Quantifying Membership Disclosure Risk for Tabular Synthetic Data Using Kernel Density Estimators

Questo lavoro propone un metodo pratico basato su stimatori di densità kernel (KDE) per quantificare il rischio di divulgazione dell'appartenenza in dati sintetici tabulari, permettendo una valutazione robusta della privacy senza la necessità di costosi modelli ombra.

Rajdeep Pathak, Sayantee Jana2026-03-12📊 stat

Safe RLHF Beyond Expectation: Stochastic Dominance for Universal Spectral Risk Control

Il paper propone RAD, un nuovo framework di allineamento per l'apprendimento per rinforzo sicuro che sostituisce i vincoli di costo atteso con vincoli di dominanza stocastica di primo ordine, permettendo un controllo universale dei rischi di coda e delle prestazioni su distribuzioni fuori dal dominio attraverso un'ottimizzazione differenziabile basata sul trasporto ottimo.

Yaswanth Chittepu, Ativ Joshi, Rajarshi Bhattacharjee, Scott Niekum2026-03-12🤖 cs.LG

When should we trust the annotation? Selective prediction for molecular structure retrieval from mass spectra

Questo articolo introduce un framework di previsione selettiva per il recupero di strutture molecolari dagli spettri di massa, dimostrando che l'uso di misure di incertezza a livello di recupero e di controllo del rischio senza distribuzione permette di ottenere annotazioni affidabili con un tasso di errore controllato, evitando così previsioni in contesti ad alto rischio.

Mira Jürgens, Gaetan De Waele, Morteza Rakhshaninejad, Willem Waegeman2026-03-12📊 stat

Ranking Reasoning LLMs under Test-Time Scaling

Questo lavoro introduce Scorio, una libreria open-source per il ranking statistico dei modelli linguistici di ragionamento sotto scaling del tempo di test, dimostrando che la maggior parte dei metodi proposti produce risultati coerenti con uno standard aureo bayesiano sia in scenari ad alto che a basso budget di trial.

Mohsen Hariri, Michael Hinczewski, Jing Ma, Vipin Chaudhary2026-03-12📊 stat

Bio-Inspired Self-Supervised Learning for Wrist-worn IMU Signals

Questo lavoro introduce un metodo di apprendimento auto-supervisionato bio-ispirato per i segnali IMU al polso, che utilizza una tokenizzazione basata sulla teoria dei sottomovimenti per superare i limiti dei dati etichettati e ottenere rappresentazioni superiori per il riconoscimento delle attività umane.

Prithviraj Tarale, Kiet Chu, Abhishek Varghese, Kai-Chun Liu, Maxwell A Xu, Mohit Iyyer, Sunghoon I. Lee2026-03-12🤖 cs.LG

Pointy - A Lightweight Transformer for Point Cloud Foundation Models

Il paper presenta Pointy, un'architettura transformer leggera per modelli fondazionali di nuvole di punti che, pur addestrata su un dataset ridotto di 39k campioni, supera modelli più grandi e complessi grazie a un'attenta progettazione e a un rigoroso studio di replicazione.

Konrad Szafer, Marek Kraft, Dominik Belter2026-03-12🤖 cs.LG

TOSSS: a CVE-based Software Security Benchmark for Large Language Models

Il paper introduce TOSSS, un nuovo benchmark basato sul database CVE per valutare la capacità dei Large Language Models di selezionare frammenti di codice sicuri rispetto a quelli vulnerabili, fornendo un punteggio di sicurezza complementare alle valutazioni esistenti.

Marc Damie, Murat Bilgehan Ertan, Domenico Essoussi, Angela Makhanu, Gaëtan Peter, Roos Wensveen2026-03-12🤖 cs.LG

FRIEND: Federated Learning for Joint Optimization of multi-RIS Configuration and Eavesdropper Intelligent Detection in B5G Networks

Questo articolo presenta un framework federato che ottimizza congiuntamente la configurazione di più superfici intelligenti riconfigurabili (RIS) e il rilevamento di intercettazioni nelle reti B5G, migliorando significativamente il tasso di segretezza e garantendo la privacy dei dati nelle comunicazioni industriali.

Maria Lamprini A. Bartsioka, Ioannis A. Bartsiokas, Anastasios K. Papazafeiropoulos, Maria A. Seimeni, Dimitra I. Kaklamani, Iakovos S. Venieris2026-03-12🤖 cs.LG

Federated Learning-driven Beam Management in LEO 6G Non-Terrestrial Networks

Questo studio dimostra che l'uso di una Rete Neurale Grafica (GNN) nell'ambito dell'Apprendimento Federato per la gestione dei fasci nelle costellazioni satellitari LEO supera le prestazioni dei modelli MLP, garantendo una selezione dei fasci più accurata e stabile, specialmente a bassi angoli di elevazione.

Maria Lamprini Bartsioka, Ioannis A. Bartsiokas, Athanasios D. Panagopoulos, Dimitra I. Kaklamani, Iakovos S. Venieris2026-03-12🔬 physics

The Discrete Charm of the MLP: Binary Routing of Continuous Signals in Transformer Feed-Forward Layers

Questo studio dimostra che i livelli MLP nei transformer eseguono un instradamento binario di segnali continui, dove specifici neuroni agiscono come interruttori che decidono quali token necessitano di elaborazione non lineare, rivelando un'architettura di consenso ed eccezione che evolve attraverso i livelli e che non può essere adeguatamente approssimata da funzioni polinomiali lisce.

Peter Balogh2026-03-12🤖 cs.LG

← Precedente Successivo →