CacheSolidarity: Preventing Prefix Caching Side Channels in Multi-tenant LLM Serving Systems

Le papier présente CacheSolidarity, un système qui sécurise les environnements d'inférence de grands modèles de langage multi-locataires contre les canaux latéraux de mise en cache de préfixes en isolant sélectivement les préfixes suspects, permettant ainsi de préserver l'efficacité et la performance sans sacrifier la sécurité.

Panagiotis Georgios Pennas, Konstantinos Papaioannou, Marco Guarnieri, Thaleia Dimitra Doudali2026-03-12🤖 cs.LG

Beyond Accuracy: Reliability and Uncertainty Estimation in Convolutional Neural Networks

Cette étude compare l'estimation d'incertitude par Dropout de Monte Carlo et la prédiction conforme sur des réseaux de neurones convolutifs entraînés sur Fashion-MNIST, révélant que si le VGG16 est plus précis, le GoogLeNet offre une meilleure calibration et que la prédiction conforme garantit des ensembles de prédictions statistiquement valides pour des décisions à haut risque.

Sanne Ruijs, Alina Kosiakova, Farrukh Javed2026-03-12📊 stat

CUPID: A Plug-in Framework for Joint Aleatoric and Epistemic Uncertainty Estimation with a Single Model

Le papier présente CUPID, un module plug-in général qui estime conjointement les incertitudes aléatoire et épistémique dans n'importe quel réseau pré-entraîné sans nécessiter de modification ni de réentraînement, offrant ainsi des estimations d'incertitude modulaires, interprétables et agnostiques au modèle pour des systèmes d'IA plus fiables.

Xinran Xu, Xiuyi Fan2026-03-12🤖 cs.LG

Deep Randomized Distributed Function Computation (DeepRDFC): Neural Distributed Channel Simulation

Ce papier propose une architecture d'autoencodeur pour le calcul de fonctions distribuées randomisées (DeepRDFC) qui minimise la distance de variation totale par rapport à une distribution cible inconnue en utilisant uniquement des échantillons de données, démontrant ainsi des gains significatifs en charge de communication par rapport aux méthodes de compression traditionnelles.

Didrik Bergström, Onur Günlü2026-03-12🔢 math

A PUF-Based Approach for Copy Protection of Intellectual Property in Neural Network Models

Cet article propose une méthode de protection des droits de propriété intellectuelle dans les réseaux de neurones en liant leurs poids à des caractéristiques matérielles uniques via des fonctions physiques non clonables (PUF), rendant ainsi l'exécution du modèle impossible sur du matériel cloné.

Daniel Dorfmeister, Flavio Ferrarotti, Bernhard Fischer, Martin Schwandtner, Hannes Sochor2026-03-12🤖 cs.LG

Prioritizing Gradient Sign Over Modulus: An Importance-Aware Framework for Wireless Federated Learning

Cet article propose un cadre d'apprentissage fédéré sans fil nommé SP-FL qui améliore la fiabilité et la précision des modèles en priorisant la transmission des signes des gradients via une allocation hiérarchique des ressources, surpassant ainsi les méthodes existantes dans des scénarios à ressources limitées.

Yiyang Yue, Jiacheng Yao, Wei Xu, Zhaohui Yang, George K. Karagiannidis, Dusit Niyato2026-03-12⚡ eess

Dynamics-Informed Deep Learning for Predicting Extreme Events

Cet article propose un cadre d'apprentissage profond entièrement piloté par les données qui combine des modes OTD pour identifier efficacement les instabilités transitoires et un modèle Transformer afin de prédire les événements extrêmes dans des systèmes dynamiques chaotiques à haute dimension, comme l'écoulement de Kolmogorov, en étendant significativement l'horizon de prévision par rapport aux approches basées uniquement sur des statistiques.

Eirini Katsidoniotaki, Themistoklis P. Sapsis2026-03-12🌀 nlin

AI-Enhanced Spatial Cellular Traffic Demand Prediction with Contextual Clustering and Error Correction for 5G/6G Planning

Cet article propose un cadre d'intelligence artificielle innovant pour la planification des réseaux 5G/6G, qui améliore la précision de la prédiction spatiale de la demande de trafic grâce à une stratégie de division contextuelle et une correction d'erreur résiduelle, réduisant ainsi les fuites de données et les erreurs de généralisation.

Mohamad Alkadamani, Colin Brown, Halim Yanikomeroglu2026-03-12⚡ eess

Protein Counterfactuals via Diffusion-Guided Latent Optimization

Ce papier présente MCCOP, un cadre d'optimisation qui utilise un modèle de diffusion pré-entraîné dans un espace latent conjoint séquence-structure pour générer des contre-factuels protéiques minimaux et biologiquement plausibles, permettant ainsi d'identifier des mutations spécifiques capables d'améliorer des propriétés telles que la stabilité ou l'activité enzymatique.

Weronika Kłos, Sidney Bender, Lukas Kades2026-03-12🤖 cs.LG

Evaluating randomized smoothing as a defense against adversarial attacks in trajectory prediction

Ce papier propose et évalue une nouvelle méthode de défense contre les attaques adverses en prédiction de trajectoires, basée sur le lissage aléatoire, démontrant qu'elle améliore la robustesse des modèles sans compromettre leur précision dans des conditions normales.

Julian F. Schumann, Eduardo Figueiredo, Frederik Baymler Mathiesen, Luca Laurenti, Jens Kober, Arkady Zgonnikov2026-03-12🤖 cs.LG

Towards Cold-Start Drafting and Continual Refining: A Value-Driven Memory Approach with Application to NPU Kernel Synthesis

Le papier présente EvoKernel, un cadre d'agents auto-évolutif qui surmonte le manque de données pour la synthèse de noyaux NPU en utilisant une approche de mémoire basée sur la valeur pour passer du brouillage initial au raffinement continu, améliorant ainsi considérablement la justesse et les performances des modèles de langage.

Yujie Zheng, Zhuo Li, Shengtao Zhang, Hanjing Wang, Junjie Sheng, Jiaqian Wang, Junchi Yan, Weinan Zhang, Ying Wen, Bo Tang, Muning Wen2026-03-12🤖 cs.LG

V0.5V_{0.5}: Generalist Value Model as a Prior for Sparse RL Rollouts

Ce papier propose V0.5V_{0.5}, un modèle de valeur généraliste qui fusionne de manière adaptative un prior pré-entraîné avec des moyennes empiriques issues de rollouts épars, en utilisant des tests statistiques en temps réel pour allouer dynamiquement le budget de calcul et ainsi minimiser la variance et le biais afin d'améliorer significativement la convergence et les performances des politiques d'apprentissage par renforcement.

Yi-Kai Zhang, Yueqing Sun, Hongyan Hao, Qi Gu, Xunliang Cai, De-Chuan Zhan, Han-Jia Ye2026-03-12🤖 cs.LG

6ABOS: An Open-Source Atmospheric Correction Framework for the EnMAP Hyperspectral Mission Based on 6S

Cet article présente 6ABOS, un cadre open-source basé sur le modèle 6S et intégré à Google Earth Engine, conçu pour automatiser la correction atmosphérique des données hyperspectrales EnMAP et permettre une estimation précise de la réflectance des eaux, comme validé par des mesures in situ dans des réservoirs méditerranéens.

Gabriel Caballero Cañas, Bárbara Alvado Arranz, Xavier Sòria-Perpinyà, Antonio Ruiz-Verdú, Jesús Delegido, José Moreno2026-03-12🤖 cs.LG