cs.LG articles | Gist.Science

COOL-MC: Verifying and Explaining RL Policies for Platelet Inventory Management

L'article présente l'application de l'outil COOL-MC pour vérifier et expliquer une politique d'apprentissage par renforcement destinée à la gestion des stocks de plaquettes, démontrant ainsi la viabilité d'une prise de décision transparente et auditable dans les chaînes d'approvisionnement de santé critiques.

Dennis Gross2026-03-04🤖 cs.AI

From Fewer Samples to Fewer Bits: Reframing Dataset Distillation as Joint Optimization of Precision and Compactness

Ce papier propose QuADD, un cadre unifié de distillation de dataset qui optimise conjointement le nombre d'échantillons et la précision de quantification sous une contrainte de bits fixe, surpassant les méthodes existantes en efficacité informationnelle pour des tâches de classification d'images et de gestion de faisceaux 3GPP.

My H. Dinh, Aditya Sant, Akshay Malhotra + 2 more2026-03-04🤖 cs.AI

Fisher-Geometric Diffusion in Stochastic Gradient Descent: Optimal Rates, Oracle Complexity, and Information-Theoretic Limits

Cet article établit une théorie géométrique de Fisher pour la descente de gradient stochastique où le bruit de mini-lots est modélisé par une matrice intrinsèque liée à l'information de Fisher, permettant de prouver des bornes minimax optimales et des garanties de complexité d'oracle qui dépendent de la structure informationnelle du problème plutôt que de la dimension ambiante.

Daniel Zantedeschi, Kumar Muthuraman2026-03-04📊 stat

Learning to Pay Attention: Unsupervised Modeling of Attentive and Inattentive Respondents in Survey Data

Cet article propose un cadre d'apprentissage non supervisé unifié pour détecter les répondants inattentifs dans les enquêtes, démontrant que la détection repose davantage sur la structure cohérente des instruments de mesure que sur la complexité des modèles, établissant ainsi un alignement entre les principes psychométriques et la détection algorithmique.

Ilias Triantafyllopoulos, Panos Ipeirotis2026-03-04🤖 cs.AI

Dimension-Independent Convergence of Underdamped Langevin Monte Carlo in KL Divergence

Cet article établit les premières bornes de divergence de Kullback-Leibler indépendantes de la dimension pour la méthode de Monte Carlo sous-amortie de Langevin discrétisée, en démontrant que la complexité dépend du trace de la borne supérieure de l'Hessienne plutôt que de la dimension ambiante.

Shiyuan Zhang, Qiwei Di, Xuheng Li + 1 more2026-03-04📊 stat

Using the SEKF to Transfer NN Models of Dynamical Systems with Limited Data

Cette étude démontre que l'utilisation du Filtre de Kalman Étendu par Sous-ensemble (SEKF) permet d'adapter efficacement des modèles de réseaux de neurones pré-entraînés à de nouveaux systèmes dynamiques avec une quantité de données réduite, en ne nécessitant que 1 % des données d'origine tout en diminuant les coûts de calcul et l'erreur de généralisation.

Joshua E. Hammond, Tyler A. Soderstrom, Brian A. Korgel + 1 more2026-03-04🤖 cs.LG

Spectral Regularization for Diffusion Models

Cet article propose un cadre de régularisation spectrale au niveau de la fonction de perte, utilisant des pertes dans les domaines de Fourier et des ondelettes pour améliorer la qualité et la cohérence multi-échelle des échantillons générés par des modèles de diffusion sans modifier leur architecture ou leur procédure d'échantillonnage.

Satish Chandran, Nicolas Roque dos Santos, Yunshu Wu + 2 more2026-03-04🤖 cs.LG

Manifold Aware Denoising Score Matching (MAD)

Cet article propose une méthode de matching de score débruité modifiée qui décompose la fonction de score en un composant analytique connu capturant la géométrie du sous-variété et un composant résiduel à apprendre, permettant ainsi d'adapter efficacement les modèles de distributions sur des variétés sans nécessiter de calculs intensifs pour apprendre la structure de la variété elle-même.

Alona Levy-Jurgenson, Alvaro Prat, James Cuin + 1 more2026-03-04📊 stat

Can Computational Reducibility Lead to Transferable Models for Graph Combinatorial Optimization?

Cet article propose un modèle neuronal fondé sur un message-passing expressif et des stratégies de pré-entraînement inspirées de la réductibilité computationnelle, démontrant ainsi la viabilité de modèles transferables et fondationnels pour résoudre divers problèmes d'optimisation combinatoire sur les graphes.

Semih Cantürk, Thomas Sabourin, Frederik Wenkel + 2 more2026-03-04🤖 cs.AI

Video TokenCom: Textual Intent-Guided Multi-Rate Video Token Communications with UEP-Based Adaptive Source-Channel Coding

Cet article propose un cadre innovant de communication vidéo par tokens, nommé Video TokenCom, qui intègre des descriptions textuelles d'intention utilisateur et un codage source-canal adaptatif à protection inégale (UEP) pour optimiser la fidélité sémantique et l'efficacité du débit dans des réseaux sans fil aux ressources limitées.

Jingxuan Men, Mahdi Boloursaz Mashhadi, Ning Wang + 3 more2026-03-04⚡ eess

Large-Scale Dataset and Benchmark for Skin Tone Classification in the Wild

Cet article présente un cadre complet pour l'équité de la classification des tons de peau, incluant un nouveau jeu de données à grande échelle (STW), des benchmarks comparatifs et un modèle d'apprentissage profond (SkinToneNet) qui atteint des performances de pointe pour l'audit de biais dans les ensembles de données publics.

Vitor Pereira Matias, Márcus Vinícius Lobo Costa, João Batista Neto + 1 more2026-03-04🤖 cs.LG

MUSE: A Run-Centric Platform for Multimodal Unified Safety Evaluation of Large Language Models

Le papier présente MUSE, une plateforme open-source centrée sur les exécutions qui évalue de manière unifiée la sécurité multimodale des grands modèles de langage en intégrant la génération automatique de charges utiles, des attaques multi-tours avec basculement inter-tours de modalités, et une métrique dualiste pour révéler que l'alignement des modèles ne se généralise pas systématiquement aux entrées audio, image et vidéo.

Zhongxi Wang, Yueqian Lin, Jingyang Zhang + 2 more2026-03-04⚡ eess

Geometric structures and deviations on James' symmetric positive-definite matrix bicone domain

Cet article introduit de nouvelles structures géométriques de type Finsler et information-géométrique duales sur le domaine des matrices définies positives, dérivées de la reparamétrisation en bicône de James, qui garantissent que les géodésiques correspondent à des lignes droites et généralisent des distances classiques comme celle du simplexe de Hilbert.

Jacek Karwowski, Frank Nielsen2026-03-04📊 stat

Learning-Augmented Moment Estimation on Time-Decay Models

Cet article propose des algorithmes d'estimation de moments améliorés par l'apprentissage pour le modèle de décroissance temporelle, en exploitant un oracle de poids lourds pour surmonter les limitations théoriques de l'estimation de fréquences et de normes dans des flux de données pondérés inégalement.

Soham Nagawanshi, Shalini Panthangi, Chen Wang + 2 more2026-03-04🤖 cs.LG

What Capable Agents Must Know: Selection Theorems for Robust Decision-Making under Uncertainty

Cet article établit des théorèmes de sélection démontrant que pour minimiser le regret moyen sur des tâches de prédiction structurées, un agent capable doit nécessairement implémenter un état interne prédictif structuré, même en l'absence d'optimalité, de déterminisme ou d'accès explicite à un modèle.

Aran Nayebi2026-03-04🧬 q-bio

ParEVO: Synthesizing Code for Irregular Data: High-Performance Parallelism through Agentic Evolution

ParEVO est un cadre innovant qui combine un corpus d'instructions spécialisé, des modèles de langage fine-tunés et un agent évolutif pour synthétiser des algorithmes parallèles haute performance capables de gérer efficacement des données irrégulières, surpassant ainsi les modèles commerciaux existants et les bases humaines en termes de vitesse d'exécution.

Liu Yang, Zeyu Nie, Andrew Liu + 4 more2026-03-04🤖 cs.LG

Thermodynamic Regulation of Finite-Time Gibbs Training in Energy-Based Models: A Restricted Boltzmann Machine Study

Cette étude propose un cadre de régulation thermodynamique endogène pour les Machines de Boltzmann Restreintes, où la température évolue dynamiquement en fonction des statistiques d'échantillonnage afin de prévenir l'instabilité et le gel des chaînes de Gibbs lors de l'entraînement, garantissant ainsi la stabilité des paramètres et améliorant la qualité de l'échantillonnage sur des données réelles comme MNIST.

Görkem Can Süleymanoğlu2026-03-04🤖 cs.LG

Bridging Diffusion Guidance and Anderson Acceleration via Hopfield Dynamics

Cet article propose la méthode GAG (Geometry Aware Attention Guidance), qui établit un lien théorique entre l'extrapolation de l'espace d'attention et l'accélération d'Anderson via les réseaux de Hopfield modernes pour stabiliser et améliorer la qualité de génération des modèles de diffusion.

Kwanyoung Kim2026-03-04🤖 cs.AI

Functional Properties of the Focal-Entropy

Cet article établit une fondation théorique pour la perte focale en analysant ses propriétés informationnelles via la notion d'entropie focale, démontrant ainsi comment elle amplifie les probabilités intermédiaires et supprime les probabilités élevées ou très faibles dans les problèmes de classification déséquilibrée.

Jaimin Shah, Martina Cardone, Alex Dytso2026-03-04📊 stat

CoDAR: Continuous Diffusion Language Models are More Powerful Than You Think

Le papier propose CoDAR, un cadre à deux étapes qui surmonte la limitation du « token rounding » dans les modèles de diffusion continus en combinant une diffusion continue dans l'espace d'embeddings avec un décodeur auto-régressif contextuel, permettant ainsi d'atteindre une qualité de génération compétitive par rapport aux modèles discrets.

Junzhe Shen, Jieru Zhao, Ziwei He + 1 more2026-03-04💬 cs.CL

← Précédent Suivant →