cs.LG articles | Gist.Science

GPUTOK: GPU Accelerated Byte Level BPE Tokenization

Ce papier présente GPUTOK, un tokeniseur BPE au niveau des bytes accéléré par GPU qui, tout en garantissant une qualité de sortie équivalente aux solutions CPU, offre une accélération significative (jusqu'à 7,6 fois) pour le traitement de longs contextes textuels.

Venu Gopal Kadamba, Kanishkha Jaisankar2026-03-04💬 cs.CL

SUN: Shared Use of Next-token Prediction for Efficient Multi-LLM Disaggregated Serving

Le papier propose SUN, une approche novatrice qui permet le partage du module de décodage entre différents grands modèles de langage en désagrégeant les tâches de préremplissage et de décodage, optimisant ainsi l'utilisation des GPU et augmentant le débit jusqu'à deux fois sans sacrifier la précision.

Sunghyeon Woo, Ahreum Seo, Jaegwang Lee + 6 more2026-03-04🤖 cs.AI

Heterogeneous Agent Collaborative Reinforcement Learning

Le papier présente HACRL, un nouveau paradigme d'apprentissage par renforcement collaboratif permettant à des agents hétérogènes de partager des trajectoires vérifiées pour une optimisation mutuelle sans coordination lors de l'inférence, et propose l'algorithme HACPO qui améliore significativement les performances de tous les agents tout en réduisant les coûts d'échantillonnage.

Zhixia Zhang, Zixuan Huang, Xin Xia + 7 more2026-03-04🤖 cs.LG

Combinatorial Sparse PCA Beyond the Spiked Identity Model

Cet article présente la première méthode combinatoire pour l'ACP parcimonieuse qui garantit une convergence globale et fonctionne avec des preuves théoriques pour des matrices de covariance générales, dépassant ainsi les limitations des algorithmes existants qui ne sont validés que sous le modèle d'identité épinglée.

Syamantak Kumar, Purnamrita Sarkar, Kevin Tian + 1 more2026-03-04📊 stat

Real-Time Generative Policy via Langevin-Guided Flow Matching for Autonomous Driving

Ce papier propose DACER-F, une méthode d'apprentissage par renforcement qui intègre le flow matching et la dynamique de Langevin pour générer des politiques de conduite autonome en temps réel avec une latence d'inférence ultra-faible tout en surpassant les performances des algorithmes existants.

Tianze Zhu, Yinuo Wang, Wenjun Zou + 6 more2026-03-04🤖 cs.LG

Detecting Structural Heart Disease from Electrocardiograms via a Generalized Additive Model of Interpretable Foundation-Model Predictors

Cette étude propose un cadre interprétable combinant des prédicteurs de modèles fondationnels ECG à un modèle additif généralisé pour détecter les maladies cardiaques structurelles, surpassant les modèles de deep learning actuels en performance et en transparence clinique.

Ya Zhou, Zhaohong Sun, Tianxiang Hao + 1 more2026-03-04📊 stat

Same Error, Different Function: The Optimizer as an Implicit Prior in Financial Time Series

Cette étude démontre que, dans le contexte de la prévision de la volatilité financière où les modèles sont sous-spécifiés, le choix de l'optimiseur agit comme un biais inductif déterminant qui façonne les fonctions apprises et les conséquences décisionnelles, même lorsque la précision prédictive reste identique.

Federico Vittorio Cortesi, Giuseppe Iannone, Giulia Crippa + 2 more2026-03-04💰 q-fin

Implicit Bias in Deep Linear Discriminant Analysis

Cet article présente une analyse théorique initiale de la régularisation implicite induite par l'analyse discriminante linéaire profonde (Deep LDA) sur des réseaux linéaires diagonaux, démontrant que l'architecture transforme les mises à jour de gradient additives en mises à jour multiplicatives conservant automatiquement une quasi-norme spécifique.

Jiawen Li2026-03-04📊 stat

Uni-Skill: Building Self-Evolving Skill Repository for Generalizable Robotic Manipulation

Le papier présente Uni-Skill, un cadre unifié qui permet l'évolution automatique d'une bibliothèque de compétences pour la manipulation robotique en intégrant une planification consciente des compétences et un référentiel hiérarchique de démonstrations extraites de vidéos, surpassant ainsi les approches existantes en généralisation zéro-shot et en adaptabilité.

Senwei Xie, Yuntian Zhang, Ruiping Wang + 1 more2026-03-04🤖 cs.LG

Post Hoc Extraction of Pareto Fronts for Continuous Control

Le papier présente MAPEX, une méthode d'apprentissage par renforcement multi-objectif hors ligne qui extrait efficacement des fronts de Pareto à partir de politiques spécialisées pré-entraînées en réutilisant leurs critiques et tampons de replay, réduisant ainsi drastiquement les coûts d'échantillonnage par rapport aux approches existantes.

Raghav Thakar, Gaurav Dixit, Kagan Tumer2026-03-04🤖 cs.LG

MASPOB: Bandit-Based Prompt Optimization for Multi-Agent Systems with Graph Neural Networks

Ce papier présente MASPOB, un cadre d'optimisation de prompts efficace en échantillons pour les systèmes multi-agents, qui combine des bandits à confiance supérieure (UCB) et des réseaux de neurones graphiques (GNN) pour surmonter les défis de coût d'évaluation, de couplage topologique et d'explosion combinatoire.

Zhi Hong, Qian Zhang, Jiahang Sun + 5 more2026-03-04🤖 cs.AI

Robust Heterogeneous Analog-Digital Computing for Mixture-of-Experts Models with Theoretical Generalization Guarantees

Cet article propose un cadre de calcul hétérogène sans réentraînement qui alloue les experts sensibles au bruit et les modules d'attention à un traitement numérique, tandis que le reste des experts est exécuté sur du matériel de calcul analogique en mémoire, garantissant ainsi la robustesse et l'efficacité des modèles MoE à grande échelle.

Mohammed Nowaz Rabbani Chowdhury, Hsinyu Tsai, Geoffrey W. Burr + 3 more2026-03-04🤖 cs.AI

SaFeR-ToolKit: Structured Reasoning via Virtual Tool Calling for Multimodal Safety

Le papier présente SaFeR-ToolKit, une approche qui formalise la prise de décision de sécurité des modèles vision-langage en un protocole vérifiable via l'appel d'outils virtuels et un entraînement en trois étapes, améliorant ainsi significativement la sécurité et le raisonnement tout en préservant les capacités générales.

Zixuan Xu, Tiancheng He, Huahui Yi + 7 more2026-03-04🤖 cs.LG

The Vienna 4G/5G Drive-Test Dataset

Cet article présente le jeu de données de tests de conduite de Vienne, une ressource open source à l'échelle urbaine combinant des mesures passives et actives de réseaux 4G et 5G avec des modèles géographiques détaillés pour faciliter l'apprentissage automatique, la modélisation de propagation et l'optimisation des réseaux mobiles.

Wilfried Wiedner, Lukas Eller, Mariam Mussbah + 4 more2026-03-04⚡ eess

Convex and Non-convex Federated Learning with Stale Stochastic Gradients: Diminishing Step Size is All You Need

Cet article propose un cadre général pour l'apprentissage fédéré avec des gradients stochastiques retardés, démontrant qu'une taille de pas décroissante prédéfinie suffit à atteindre les taux de convergence optimaux pour les objectifs convexes et non convexes, sans nécessiter de tailles de pas adaptatives.

Xinran Zheng, Tara Javidi, Behrouz Touri2026-03-04🤖 cs.LG

HomeAdam: Adam and AdamW Algorithms Sometimes Go Home to Obtain Better Provable Generalization

Ce papier propose et analyse théoriquement la famille d'algorithmes HomeAdam(W), qui améliore la généralisation et la convergence des méthodes Adam et AdamW en alternant avec des étapes de descente de gradient stochastique momentum, prouvant ainsi une erreur de généralisation de l'ordre de $O(1/N)$ supérieure à celle des variantes existantes.

Feihu Huang, Guanyi Zhang, Songcan Chen2026-03-04📊 stat

Improving Diffusion Planners by Self-Supervised Action Gating with Energies

Ce papier propose SAGE, une méthode d'inférence qui améliore la robustesse des planificateurs de diffusion en rééchantillonnant les actions grâce à un signal de cohérence dynamique appris via une architecture JEPA, sans nécessiter de réentraînement ni de rollouts environnementaux.

Yuan Lu, Dongqi Han, Yansen Wang + 1 more2026-03-04🤖 cs.AI

DREAM: Where Visual Understanding Meets Text-to-Image Generation

Le papier présente DREAM, un cadre unifié qui combine l'apprentissage de représentations visuelles et la génération d'images à partir de texte grâce à des techniques innovantes comme le réchauffement du masquage et le décodage aligné sémantiquement, permettant d'obtenir des performances supérieures à la fois en compréhension visuelle et en génération sans nécessiter de réordonnanceurs externes.

Chao Li, Tianhong Li, Sai Vidyaranya Nuthalapati + 8 more2026-03-04🤖 cs.LG

SorryDB: Can AI Provers Complete Real-World Lean Theorems?

Cette présentation de SorryDB, une nouvelle base de référence dynamique pour les tâches Lean issues de projets réels, révèle que les approches actuelles de preuve assistée par IA sont complémentaires et que les modèles d'agents les plus performants ne surpassent pas systématiquement les autres méthodes existantes.

Austin Letson, Leopoldo Sarra, Auguste Poiroux + 9 more2026-03-04🤖 cs.AI

Exact Functional ANOVA Decomposition for Categorical Inputs Models

Cet article propose une décomposition fonctionnelle ANOVA exacte et efficace en forme fermée pour les modèles à entrées catégorielles, valable pour toute distribution de dépendance et permettant une généralisation naturelle des valeurs SHAP.

Baptiste Ferrere, Nicolas Bousquet, Fabrice Gamboa + 2 more2026-03-04📊 stat

← Précédent Suivant →