cs.LG articoli | Gist.Science

EvoSchema: Towards Text-to-SQL Robustness Against Schema Evolution

Il paper presenta EvoSchema, un benchmark completo che introduce una nuova tassonomia di evoluzione degli schemi per valutare e migliorare la robustezza dei modelli Text-to-SQL contro i cambiamenti reali dei database, rivelando che le perturbazioni a livello di tabella hanno un impatto maggiore rispetto a quelle a livello di colonna e dimostrando che l'addestramento su schemi perturbati genera sistemi più resilienti.

Tianshu Zhang, Kun Qian, Siddhartha Sahai, Yuan Tian, Shaddy Garg, Huan Sun, Yunyao Li2026-03-12💬 cs.CL

Riemannian MeanFlow for One-Step Generation on Manifolds

Il paper propone Riemannian MeanFlow (RMF), un metodo che estende il MeanFlow alle varietà Riemanniane permettendo la generazione in un singolo passo attraverso un'identità geometrica basata sul trasporto parallelo e un'apprendimento multi-task consapevole dei conflitti, eliminando così la necessità di costose integrazioni numeriche.

Zichen Zhong, Haoliang Sun, Yukun Zhao, Yongshun Gong, Yilong Yin2026-03-12🤖 cs.LG

Sample-and-Search: An Effective Algorithm for Learning-Augmented k-Median Clustering in High dimensions

Il paper propone l'algoritmo "Sample-and-Search", un metodo basato sul campionamento che risolve il problema del clustering k-mediane potenziato dall'apprendimento in spazi ad alta dimensionalità, riducendo significativamente la complessità computazionale e il costo di clustering rispetto agli approcci esistenti.

Kangke Cheng, Shihong Song, Guanlin Mo, Hu Ding2026-03-12🤖 cs.LG

CacheSolidarity: Preventing Prefix Caching Side Channels in Multi-tenant LLM Serving Systems

Il paper presenta CacheSolidarity, un sistema che protegge i sistemi di serving LLM multi-tenant dagli attacchi side-channel derivanti dalla cache dei prefissi, monitorando e isolando selettivamente le condivisioni sospette per garantire sicurezza senza sacrificare le prestazioni.

Panagiotis Georgios Pennas, Konstantinos Papaioannou, Marco Guarnieri, Thaleia Dimitra Doudali2026-03-12🤖 cs.LG

Beyond Accuracy: Reliability and Uncertainty Estimation in Convolutional Neural Networks

Questo studio confronta l'approssimazione bayesiana tramite Monte Carlo Dropout e il framework di Conformal Prediction su due architetture CNN addestrate su Fashion-MNIST, evidenziando come GoogLeNet offra stime di incertezza meglio calibrate rispetto a H-CNN VGG16 e come il Conformal Prediction garantisca validità statistica cruciale per decisioni ad alto rischio.

Sanne Ruijs, Alina Kosiakova, Farrukh Javed2026-03-12📊 stat

A Grammar of Machine Learning Workflows

Questo articolo propone una soluzione strutturale al problema della fuoriuscita di dati (data leakage) nella formazione di modelli di machine learning, introducendo una grammatica basata su un grafo aciclico diretto con vincoli rigidi che impediscono l'errore di valutazione ripetuta sul set di test, superando così i limiti delle mere linee guida documentali.

Simon Roth2026-03-12🤖 cs.LG

CUPID: A Plug-in Framework for Joint Aleatoric and Epistemic Uncertainty Estimation with a Single Model

Il paper introduce CUPID, un framework plug-in che stima congiuntamente l'incertezza aleatoria ed epistemica in qualsiasi modello pre-addestrato senza necessità di riaddestramento, offrendo così un approccio modulare e interpretabile per decisioni consapevoli del rischio in ambiti critici.

Xinran Xu, Xiuyi Fan2026-03-12🤖 cs.LG

Deep Randomized Distributed Function Computation (DeepRDFC): Neural Distributed Channel Simulation

Il paper propone un'architettura di autoencoder basata sull'apprendimento profondo per il calcolo distribuito randomizzato (DeepRDFC) che minimizza la distanza di variazione totale rispetto a una distribuzione target sconosciuta, ottenendo guadagni significativi nel carico di comunicazione rispetto ai metodi di compressione dei dati.

Didrik Bergström, Onur Günlü2026-03-12🔢 math

A PUF-Based Approach for Copy Protection of Intellectual Property in Neural Network Models

Il paper propone un metodo per proteggere la proprietà intellettuale nei modelli di reti neurali legando i loro pesi alle caratteristiche hardware uniche tramite Funzioni Fisiche Non Clonabili (PUF), rendendo di fatto impossibile l'esecuzione accurata del modello su hardware clonato.

Daniel Dorfmeister, Flavio Ferrarotti, Bernhard Fischer, Martin Schwandtner, Hannes Sochor2026-03-12🤖 cs.LG

Prioritizing Gradient Sign Over Modulus: An Importance-Aware Framework for Wireless Federated Learning

Il documento propone SP-FL, un nuovo framework per l'apprendimento federato wireless che migliora l'efficienza e l'affidabilità della comunicazione prioritizzando la trasmissione dei segni dei gradienti e ottimizzando l'allocazione delle risorse a livello di pacchetto e dispositivo, ottenendo risultati superiori rispetto ai metodi esistenti in scenari con risorse limitate.

Yiyang Yue, Jiacheng Yao, Wei Xu, Zhaohui Yang, George K. Karagiannidis, Dusit Niyato2026-03-12⚡ eess

Dynamics-Informed Deep Learning for Predicting Extreme Events

Il paper propone un framework di deep learning basato su dati che combina precursori interpretabili derivati da instabilità transitorie (calcolati efficientemente tramite modalità OTD in un sottospazio ridotto) e modelli Transformer per prevedere eventi estremi in sistemi dinamici caotici ad alta dimensionalità, superando i limiti degli approcci puramente statistici.

Eirini Katsidoniotaki, Themistoklis P. Sapsis2026-03-12🌀 nlin

Taking Shortcuts for Categorical VQA Using Super Neurons

Il paper introduce i "Super Neurons", un metodo di probing che utilizza le attivazioni scalari dirette dei primi token nei livelli più superficiali dei modelli visione-linguaggio per ottenere classificatori ad alte prestazioni con un'accelerazione fino a 5,10 volte rispetto alla rete originale.

Pierre Musacchio, Jaeyi Jeong, Dahun Kim, Jaesik Park2026-03-12🤖 cs.AI

AI-Enhanced Spatial Cellular Traffic Demand Prediction with Contextual Clustering and Error Correction for 5G/6G Planning

Questo articolo presenta un framework di intelligenza artificiale che, combinando una strategia di suddivisione dei dati contestuale e una correzione degli errori spaziali, migliora l'accuratezza della previsione della domanda di traffico cellulare per la pianificazione delle reti 5G/6G, riducendo il rischio di leakage spaziale e garantendo una migliore generalizzazione.

Mohamad Alkadamani, Colin Brown, Halim Yanikomeroglu2026-03-12⚡ eess

Towards Intelligent Spectrum Management: Spectrum Demand Estimation Using Graph Neural Networks

Questo articolo presenta un modello basato su Graph Neural Networks (HR-GAT) che stima la domanda di spettro a livello locale utilizzando dati pubblici, migliorando significativamente l'efficienza della gestione e dell'allocazione delle risorse wireless.

Mohamad Alkadamani, Amir Ghasemi, Halim Yanikomeroglu2026-03-12⚡ eess

Protein Counterfactuals via Diffusion-Guided Latent Optimization

Il paper introduce MCCOP, un framework che utilizza l'ottimizzazione latente guidata da modelli di diffusione per generare modifiche minimali e biologicamente plausibili alle sequenze proteiche, consentendo di invertire le previsioni dei modelli di deep learning verso stati desiderati e fornendo così indicazioni attuabili per l'ingegneria proteica.

Weronika Kłos, Sidney Bender, Lukas Kades2026-03-12🤖 cs.LG

Evaluating randomized smoothing as a defense against adversarial attacks in trajectory prediction

Questo lavoro dimostra che l'uso della regolarizzazione casuale (randomized smoothing) costituisce una difesa efficace, semplice ed economica per migliorare la robustezza dei modelli di previsione delle traiettorie contro gli attacchi avversari, senza comprometterne l'accuratezza in condizioni normali.

Julian F. Schumann, Eduardo Figueiredo, Frederik Baymler Mathiesen, Luca Laurenti, Jens Kober, Arkady Zgonnikov2026-03-12🤖 cs.LG

ReTabSyn: Realistic Tabular Data Synthesis via Reinforcement Learning

Il paper presenta ReTabSyn, un metodo di sintesi tabulare basato sul reinforcement learning che, focalizzandosi sulla distribuzione condizionale $P(y\mid \bm{X})$ anziché su quella congiunta completa, migliora l'efficienza dei dati e le prestazioni dei modelli predittivi in scenari con campioni limitati e squilibrio delle classi.

Xiaofeng Lin, Seungbae Kim, Zhuoya Li, Zachary DeSoto, Charles Fleming, Guang Cheng2026-03-12📊 stat

Towards Cold-Start Drafting and Continual Refining: A Value-Driven Memory Approach with Application to NPU Kernel Synthesis

Il paper presenta EvoKernel, un framework agenziale auto-evolutivo basato su un approccio di memoria guidata dal valore che supera la scarsità di dati nella sintesi di kernel per architetture NPU, migliorando drasticamente la correttezza e le prestazioni attraverso un processo di stesura iniziale e raffinamento continuo.

Yujie Zheng, Zhuo Li, Shengtao Zhang, Hanjing Wang, Junjie Sheng, Jiaqian Wang, Junchi Yan, Weinan Zhang, Ying Wen, Bo Tang, Muning Wen2026-03-12🤖 cs.LG

$V_{0.5}$ : Generalist Value Model as a Prior for Sparse RL Rollouts

Il paper propone $V_{0.5}$ , un modello di valore generalista che fonde adattivamente una previsione a priori con medie empiriche da rollouts sparsi tramite test statistici in tempo reale, ottenendo una stima del baseline a bassa varianza che supera significativamente GRPO e DAPO su sei benchmark di ragionamento matematico.

Yi-Kai Zhang, Yueqing Sun, Hongyan Hao, Qi Gu, Xunliang Cai, De-Chuan Zhan, Han-Jia Ye2026-03-12🤖 cs.LG

6ABOS: An Open-Source Atmospheric Correction Framework for the EnMAP Hyperspectral Mission Based on 6S

Questo articolo presenta 6ABOS, un nuovo framework open-source basato su Python e sul modello 6S che automatizza la correzione atmosferica delle immagini iperspettrali EnMAP per il monitoraggio delle acque, dimostrando un'elevata accuratezza nella stima della riflettanza del fondo marino su bacini mediterranei.

Gabriel Caballero Cañas, Bárbara Alvado Arranz, Xavier Sòria-Perpinyà, Antonio Ruiz-Verdú, Jesús Delegido, José Moreno2026-03-12🤖 cs.LG

← Precedente Successivo →

cs.LG