EvoSchema: Towards Text-to-SQL Robustness Against Schema Evolution

Il paper presenta EvoSchema, un benchmark completo che introduce una nuova tassonomia di evoluzione degli schemi per valutare e migliorare la robustezza dei modelli Text-to-SQL contro i cambiamenti reali dei database, rivelando che le perturbazioni a livello di tabella hanno un impatto maggiore rispetto a quelle a livello di colonna e dimostrando che l'addestramento su schemi perturbati genera sistemi più resilienti.

Tianshu Zhang, Kun Qian, Siddhartha Sahai, Yuan Tian, Shaddy Garg, Huan Sun, Yunyao Li2026-03-12💬 cs.CL

Beyond Accuracy: Reliability and Uncertainty Estimation in Convolutional Neural Networks

Questo studio confronta l'approssimazione bayesiana tramite Monte Carlo Dropout e il framework di Conformal Prediction su due architetture CNN addestrate su Fashion-MNIST, evidenziando come GoogLeNet offra stime di incertezza meglio calibrate rispetto a H-CNN VGG16 e come il Conformal Prediction garantisca validità statistica cruciale per decisioni ad alto rischio.

Sanne Ruijs, Alina Kosiakova, Farrukh Javed2026-03-12📊 stat

Prioritizing Gradient Sign Over Modulus: An Importance-Aware Framework for Wireless Federated Learning

Il documento propone SP-FL, un nuovo framework per l'apprendimento federato wireless che migliora l'efficienza e l'affidabilità della comunicazione prioritizzando la trasmissione dei segni dei gradienti e ottimizzando l'allocazione delle risorse a livello di pacchetto e dispositivo, ottenendo risultati superiori rispetto ai metodi esistenti in scenari con risorse limitate.

Yiyang Yue, Jiacheng Yao, Wei Xu, Zhaohui Yang, George K. Karagiannidis, Dusit Niyato2026-03-12⚡ eess

AI-Enhanced Spatial Cellular Traffic Demand Prediction with Contextual Clustering and Error Correction for 5G/6G Planning

Questo articolo presenta un framework di intelligenza artificiale che, combinando una strategia di suddivisione dei dati contestuale e una correzione degli errori spaziali, migliora l'accuratezza della previsione della domanda di traffico cellulare per la pianificazione delle reti 5G/6G, riducendo il rischio di leakage spaziale e garantendo una migliore generalizzazione.

Mohamad Alkadamani, Colin Brown, Halim Yanikomeroglu2026-03-12⚡ eess

Evaluating randomized smoothing as a defense against adversarial attacks in trajectory prediction

Questo lavoro dimostra che l'uso della regolarizzazione casuale (randomized smoothing) costituisce una difesa efficace, semplice ed economica per migliorare la robustezza dei modelli di previsione delle traiettorie contro gli attacchi avversari, senza comprometterne l'accuratezza in condizioni normali.

Julian F. Schumann, Eduardo Figueiredo, Frederik Baymler Mathiesen, Luca Laurenti, Jens Kober, Arkady Zgonnikov2026-03-12🤖 cs.LG

ReTabSyn: Realistic Tabular Data Synthesis via Reinforcement Learning

Il paper presenta ReTabSyn, un metodo di sintesi tabulare basato sul reinforcement learning che, focalizzandosi sulla distribuzione condizionale P(yX)P(y\mid \bm{X}) anziché su quella congiunta completa, migliora l'efficienza dei dati e le prestazioni dei modelli predittivi in scenari con campioni limitati e squilibrio delle classi.

Xiaofeng Lin, Seungbae Kim, Zhuoya Li, Zachary DeSoto, Charles Fleming, Guang Cheng2026-03-12📊 stat

Towards Cold-Start Drafting and Continual Refining: A Value-Driven Memory Approach with Application to NPU Kernel Synthesis

Il paper presenta EvoKernel, un framework agenziale auto-evolutivo basato su un approccio di memoria guidata dal valore che supera la scarsità di dati nella sintesi di kernel per architetture NPU, migliorando drasticamente la correttezza e le prestazioni attraverso un processo di stesura iniziale e raffinamento continuo.

Yujie Zheng, Zhuo Li, Shengtao Zhang, Hanjing Wang, Junjie Sheng, Jiaqian Wang, Junchi Yan, Weinan Zhang, Ying Wen, Bo Tang, Muning Wen2026-03-12🤖 cs.LG

V0.5V_{0.5}: Generalist Value Model as a Prior for Sparse RL Rollouts

Il paper propone V0.5V_{0.5}, un modello di valore generalista che fonde adattivamente una previsione a priori con medie empiriche da rollouts sparsi tramite test statistici in tempo reale, ottenendo una stima del baseline a bassa varianza che supera significativamente GRPO e DAPO su sei benchmark di ragionamento matematico.

Yi-Kai Zhang, Yueqing Sun, Hongyan Hao, Qi Gu, Xunliang Cai, De-Chuan Zhan, Han-Jia Ye2026-03-12🤖 cs.LG

6ABOS: An Open-Source Atmospheric Correction Framework for the EnMAP Hyperspectral Mission Based on 6S

Questo articolo presenta 6ABOS, un nuovo framework open-source basato su Python e sul modello 6S che automatizza la correzione atmosferica delle immagini iperspettrali EnMAP per il monitoraggio delle acque, dimostrando un'elevata accuratezza nella stima della riflettanza del fondo marino su bacini mediterranei.

Gabriel Caballero Cañas, Bárbara Alvado Arranz, Xavier Sòria-Perpinyà, Antonio Ruiz-Verdú, Jesús Delegido, José Moreno2026-03-12🤖 cs.LG