cs.LG articles | Gist.Science

EvoSchema: Towards Text-to-SQL Robustness Against Schema Evolution

Le papier présente EvoSchema, une nouvelle benchmark et une taxonomie d'évolution de schéma conçues pour évaluer et améliorer la robustesse des modèles Text-to-SQL face aux changements dynamiques des bases de données, révélant notamment l'impact critique des modifications au niveau des tables.

Tianshu Zhang, Kun Qian, Siddhartha Sahai, Yuan Tian, Shaddy Garg, Huan Sun, Yunyao Li2026-03-12💬 cs.CL

Riemannian MeanFlow for One-Step Generation on Manifolds

Ce papier propose Riemannian MeanFlow, une méthode permettant la génération en une seule étape sur des variétés riemanniennes en évitant l'intégration numérique d'EDOs grâce à une identité reliant les vitesses moyennes et instantanées via le transport parallèle.

Zichen Zhong, Haoliang Sun, Yukun Zhao, Yongshun Gong, Yilong Yin2026-03-12🤖 cs.LG

Sample-and-Search: An Effective Algorithm for Learning-Augmented k-Median Clustering in High dimensions

Cet article présente l'algorithme « Sample-and-Search », une méthode d'apprentissage augmenté pour le clustering $k$ -médiane en haute dimension qui améliore significativement la complexité temporelle et réduit la dépendance exponentielle à la dimensionnalité par rapport aux approches existantes.

Kangke Cheng, Shihong Song, Guanlin Mo, Hu Ding2026-03-12🤖 cs.LG

CacheSolidarity: Preventing Prefix Caching Side Channels in Multi-tenant LLM Serving Systems

Le papier présente CacheSolidarity, un système qui sécurise les environnements d'inférence de grands modèles de langage multi-locataires contre les canaux latéraux de mise en cache de préfixes en isolant sélectivement les préfixes suspects, permettant ainsi de préserver l'efficacité et la performance sans sacrifier la sécurité.

Panagiotis Georgios Pennas, Konstantinos Papaioannou, Marco Guarnieri, Thaleia Dimitra Doudali2026-03-12🤖 cs.LG

Beyond Accuracy: Reliability and Uncertainty Estimation in Convolutional Neural Networks

Cette étude compare l'estimation d'incertitude par Dropout de Monte Carlo et la prédiction conforme sur des réseaux de neurones convolutifs entraînés sur Fashion-MNIST, révélant que si le VGG16 est plus précis, le GoogLeNet offre une meilleure calibration et que la prédiction conforme garantit des ensembles de prédictions statistiquement valides pour des décisions à haut risque.

Sanne Ruijs, Alina Kosiakova, Farrukh Javed2026-03-12📊 stat

A Grammar of Machine Learning Workflows

Cet article propose une grammaire structurelle pour les workflows d'apprentissage automatique, fondée sur un graphe orienté acyclique typé et des contraintes d'exécution, afin de prévenir de manière rigoureuse les fuites de données qui faussent les performances des modèles.

Simon Roth2026-03-12🤖 cs.LG

CUPID: A Plug-in Framework for Joint Aleatoric and Epistemic Uncertainty Estimation with a Single Model

Le papier présente CUPID, un module plug-in général qui estime conjointement les incertitudes aléatoire et épistémique dans n'importe quel réseau pré-entraîné sans nécessiter de modification ni de réentraînement, offrant ainsi des estimations d'incertitude modulaires, interprétables et agnostiques au modèle pour des systèmes d'IA plus fiables.

Xinran Xu, Xiuyi Fan2026-03-12🤖 cs.LG

Deep Randomized Distributed Function Computation (DeepRDFC): Neural Distributed Channel Simulation

Ce papier propose une architecture d'autoencodeur pour le calcul de fonctions distribuées randomisées (DeepRDFC) qui minimise la distance de variation totale par rapport à une distribution cible inconnue en utilisant uniquement des échantillons de données, démontrant ainsi des gains significatifs en charge de communication par rapport aux méthodes de compression traditionnelles.

Didrik Bergström, Onur Günlü2026-03-12🔢 math

A PUF-Based Approach for Copy Protection of Intellectual Property in Neural Network Models

Cet article propose une méthode de protection des droits de propriété intellectuelle dans les réseaux de neurones en liant leurs poids à des caractéristiques matérielles uniques via des fonctions physiques non clonables (PUF), rendant ainsi l'exécution du modèle impossible sur du matériel cloné.

Daniel Dorfmeister, Flavio Ferrarotti, Bernhard Fischer, Martin Schwandtner, Hannes Sochor2026-03-12🤖 cs.LG

Prioritizing Gradient Sign Over Modulus: An Importance-Aware Framework for Wireless Federated Learning

Cet article propose un cadre d'apprentissage fédéré sans fil nommé SP-FL qui améliore la fiabilité et la précision des modèles en priorisant la transmission des signes des gradients via une allocation hiérarchique des ressources, surpassant ainsi les méthodes existantes dans des scénarios à ressources limitées.

Yiyang Yue, Jiacheng Yao, Wei Xu, Zhaohui Yang, George K. Karagiannidis, Dusit Niyato2026-03-12⚡ eess

Dynamics-Informed Deep Learning for Predicting Extreme Events

Cet article propose un cadre d'apprentissage profond entièrement piloté par les données qui combine des modes OTD pour identifier efficacement les instabilités transitoires et un modèle Transformer afin de prédire les événements extrêmes dans des systèmes dynamiques chaotiques à haute dimension, comme l'écoulement de Kolmogorov, en étendant significativement l'horizon de prévision par rapport aux approches basées uniquement sur des statistiques.

Eirini Katsidoniotaki, Themistoklis P. Sapsis2026-03-12🌀 nlin

Taking Shortcuts for Categorical VQA Using Super Neurons

Cet article propose l'utilisation de « Super Neurons », des activations scalaires extraites des premières couches des modèles vision-langage, pour créer des classificateurs précis et rapides permettant une sortie anticipée du modèle avec un gain de vitesse allant jusqu'à 5,10 fois.

Pierre Musacchio, Jaeyi Jeong, Dahun Kim, Jaesik Park2026-03-12🤖 cs.AI

AI-Enhanced Spatial Cellular Traffic Demand Prediction with Contextual Clustering and Error Correction for 5G/6G Planning

Cet article propose un cadre d'intelligence artificielle innovant pour la planification des réseaux 5G/6G, qui améliore la précision de la prédiction spatiale de la demande de trafic grâce à une stratégie de division contextuelle et une correction d'erreur résiduelle, réduisant ainsi les fuites de données et les erreurs de généralisation.

Mohamad Alkadamani, Colin Brown, Halim Yanikomeroglu2026-03-12⚡ eess

Towards Intelligent Spectrum Management: Spectrum Demand Estimation Using Graph Neural Networks

Cet article propose un modèle hiérarchique à base de réseaux de neurones graphiques (HR-GAT) pour estimer avec précision la demande spectrale à l'échelle fine, réduisant significativement les erreurs de prédiction et les biais spatiaux afin d'optimiser la gestion et le partage du spectre pour les régulateurs.

Mohamad Alkadamani, Amir Ghasemi, Halim Yanikomeroglu2026-03-12⚡ eess

Protein Counterfactuals via Diffusion-Guided Latent Optimization

Ce papier présente MCCOP, un cadre d'optimisation qui utilise un modèle de diffusion pré-entraîné dans un espace latent conjoint séquence-structure pour générer des contre-factuels protéiques minimaux et biologiquement plausibles, permettant ainsi d'identifier des mutations spécifiques capables d'améliorer des propriétés telles que la stabilité ou l'activité enzymatique.

Weronika Kłos, Sidney Bender, Lukas Kades2026-03-12🤖 cs.LG

Evaluating randomized smoothing as a defense against adversarial attacks in trajectory prediction

Ce papier propose et évalue une nouvelle méthode de défense contre les attaques adverses en prédiction de trajectoires, basée sur le lissage aléatoire, démontrant qu'elle améliore la robustesse des modèles sans compromettre leur précision dans des conditions normales.

Julian F. Schumann, Eduardo Figueiredo, Frederik Baymler Mathiesen, Luca Laurenti, Jens Kober, Arkady Zgonnikov2026-03-12🤖 cs.LG

ReTabSyn: Realistic Tabular Data Synthesis via Reinforcement Learning

Le papier présente ReTabSyn, une pipeline de synthèse de données tabulaires basée sur l'apprentissage par renforcement qui optimise la distribution conditionnelle pour améliorer l'utilité des modèles en aval dans des scénarios à faible volume de données et déséquilibrés.

Xiaofeng Lin, Seungbae Kim, Zhuoya Li, Zachary DeSoto, Charles Fleming, Guang Cheng2026-03-12📊 stat

Towards Cold-Start Drafting and Continual Refining: A Value-Driven Memory Approach with Application to NPU Kernel Synthesis

Le papier présente EvoKernel, un cadre d'agents auto-évolutif qui surmonte le manque de données pour la synthèse de noyaux NPU en utilisant une approche de mémoire basée sur la valeur pour passer du brouillage initial au raffinement continu, améliorant ainsi considérablement la justesse et les performances des modèles de langage.

Yujie Zheng, Zhuo Li, Shengtao Zhang, Hanjing Wang, Junjie Sheng, Jiaqian Wang, Junchi Yan, Weinan Zhang, Ying Wen, Bo Tang, Muning Wen2026-03-12🤖 cs.LG

$V_{0.5}$ : Generalist Value Model as a Prior for Sparse RL Rollouts

Ce papier propose $V_{0.5}$ , un modèle de valeur généraliste qui fusionne de manière adaptative un prior pré-entraîné avec des moyennes empiriques issues de rollouts épars, en utilisant des tests statistiques en temps réel pour allouer dynamiquement le budget de calcul et ainsi minimiser la variance et le biais afin d'améliorer significativement la convergence et les performances des politiques d'apprentissage par renforcement.

Yi-Kai Zhang, Yueqing Sun, Hongyan Hao, Qi Gu, Xunliang Cai, De-Chuan Zhan, Han-Jia Ye2026-03-12🤖 cs.LG

6ABOS: An Open-Source Atmospheric Correction Framework for the EnMAP Hyperspectral Mission Based on 6S

Cet article présente 6ABOS, un cadre open-source basé sur le modèle 6S et intégré à Google Earth Engine, conçu pour automatiser la correction atmosphérique des données hyperspectrales EnMAP et permettre une estimation précise de la réflectance des eaux, comme validé par des mesures in situ dans des réservoirs méditerranéens.

Gabriel Caballero Cañas, Bárbara Alvado Arranz, Xavier Sòria-Perpinyà, Antonio Ruiz-Verdú, Jesús Delegido, José Moreno2026-03-12🤖 cs.LG

← Précédent Suivant →

cs.LG