From Fewer Samples to Fewer Bits: Reframing Dataset Distillation as Joint Optimization of Precision and Compactness

Ce papier propose QuADD, un cadre unifié de distillation de dataset qui optimise conjointement le nombre d'échantillons et la précision de quantification sous une contrainte de bits fixe, surpassant les méthodes existantes en efficacité informationnelle pour des tâches de classification d'images et de gestion de faisceaux 3GPP.

My H. Dinh, Aditya Sant, Akshay Malhotra + 2 more2026-03-04🤖 cs.AI

Fisher-Geometric Diffusion in Stochastic Gradient Descent: Optimal Rates, Oracle Complexity, and Information-Theoretic Limits

Cet article établit une théorie géométrique de Fisher pour la descente de gradient stochastique où le bruit de mini-lots est modélisé par une matrice intrinsèque liée à l'information de Fisher, permettant de prouver des bornes minimax optimales et des garanties de complexité d'oracle qui dépendent de la structure informationnelle du problème plutôt que de la dimension ambiante.

Daniel Zantedeschi, Kumar Muthuraman2026-03-04📊 stat

Learning to Pay Attention: Unsupervised Modeling of Attentive and Inattentive Respondents in Survey Data

Cet article propose un cadre d'apprentissage non supervisé unifié pour détecter les répondants inattentifs dans les enquêtes, démontrant que la détection repose davantage sur la structure cohérente des instruments de mesure que sur la complexité des modèles, établissant ainsi un alignement entre les principes psychométriques et la détection algorithmique.

Ilias Triantafyllopoulos, Panos Ipeirotis2026-03-04🤖 cs.AI

Using the SEKF to Transfer NN Models of Dynamical Systems with Limited Data

Cette étude démontre que l'utilisation du Filtre de Kalman Étendu par Sous-ensemble (SEKF) permet d'adapter efficacement des modèles de réseaux de neurones pré-entraînés à de nouveaux systèmes dynamiques avec une quantité de données réduite, en ne nécessitant que 1 % des données d'origine tout en diminuant les coûts de calcul et l'erreur de généralisation.

Joshua E. Hammond, Tyler A. Soderstrom, Brian A. Korgel + 1 more2026-03-04🤖 cs.LG

Manifold Aware Denoising Score Matching (MAD)

Cet article propose une méthode de matching de score débruité modifiée qui décompose la fonction de score en un composant analytique connu capturant la géométrie du sous-variété et un composant résiduel à apprendre, permettant ainsi d'adapter efficacement les modèles de distributions sur des variétés sans nécessiter de calculs intensifs pour apprendre la structure de la variété elle-même.

Alona Levy-Jurgenson, Alvaro Prat, James Cuin + 1 more2026-03-04📊 stat

Video TokenCom: Textual Intent-Guided Multi-Rate Video Token Communications with UEP-Based Adaptive Source-Channel Coding

Cet article propose un cadre innovant de communication vidéo par tokens, nommé Video TokenCom, qui intègre des descriptions textuelles d'intention utilisateur et un codage source-canal adaptatif à protection inégale (UEP) pour optimiser la fidélité sémantique et l'efficacité du débit dans des réseaux sans fil aux ressources limitées.

Jingxuan Men, Mahdi Boloursaz Mashhadi, Ning Wang + 3 more2026-03-04⚡ eess

Large-Scale Dataset and Benchmark for Skin Tone Classification in the Wild

Cet article présente un cadre complet pour l'équité de la classification des tons de peau, incluant un nouveau jeu de données à grande échelle (STW), des benchmarks comparatifs et un modèle d'apprentissage profond (SkinToneNet) qui atteint des performances de pointe pour l'audit de biais dans les ensembles de données publics.

Vitor Pereira Matias, Márcus Vinícius Lobo Costa, João Batista Neto + 1 more2026-03-04🤖 cs.LG

MUSE: A Run-Centric Platform for Multimodal Unified Safety Evaluation of Large Language Models

Le papier présente MUSE, une plateforme open-source centrée sur les exécutions qui évalue de manière unifiée la sécurité multimodale des grands modèles de langage en intégrant la génération automatique de charges utiles, des attaques multi-tours avec basculement inter-tours de modalités, et une métrique dualiste pour révéler que l'alignement des modèles ne se généralise pas systématiquement aux entrées audio, image et vidéo.

Zhongxi Wang, Yueqian Lin, Jingyang Zhang + 2 more2026-03-04⚡ eess

Geometric structures and deviations on James' symmetric positive-definite matrix bicone domain

Cet article introduit de nouvelles structures géométriques de type Finsler et information-géométrique duales sur le domaine des matrices définies positives, dérivées de la reparamétrisation en bicône de James, qui garantissent que les géodésiques correspondent à des lignes droites et généralisent des distances classiques comme celle du simplexe de Hilbert.

Jacek Karwowski, Frank Nielsen2026-03-04📊 stat

ParEVO: Synthesizing Code for Irregular Data: High-Performance Parallelism through Agentic Evolution

ParEVO est un cadre innovant qui combine un corpus d'instructions spécialisé, des modèles de langage fine-tunés et un agent évolutif pour synthétiser des algorithmes parallèles haute performance capables de gérer efficacement des données irrégulières, surpassant ainsi les modèles commerciaux existants et les bases humaines en termes de vitesse d'exécution.

Liu Yang, Zeyu Nie, Andrew Liu + 4 more2026-03-04🤖 cs.LG

Thermodynamic Regulation of Finite-Time Gibbs Training in Energy-Based Models: A Restricted Boltzmann Machine Study

Cette étude propose un cadre de régulation thermodynamique endogène pour les Machines de Boltzmann Restreintes, où la température évolue dynamiquement en fonction des statistiques d'échantillonnage afin de prévenir l'instabilité et le gel des chaînes de Gibbs lors de l'entraînement, garantissant ainsi la stabilité des paramètres et améliorant la qualité de l'échantillonnage sur des données réelles comme MNIST.

Görkem Can Süleymanoğlu2026-03-04🤖 cs.LG