stat.ML articles | Gist.Science

Learning under Distributional Drift: Prequential Reproducibility as an Intrinsic Statistical Resource

Cet article introduit un budget de dérive intrinsèque mesuré par la distance de Fisher-Rao pour caractériser l'apprentissage sous dérive distributionnelle dans des boucles fermées, établissant des bornes de reproductibilité préquentielle qui démontrent que la précision à court terme est fondamentalement limitée par le taux moyen de dérive.

Sofiya Zaichyk2026-03-05🤖 cs.LG

Synthetic Augmentation in Imbalanced Learning: When It Helps, When It Hurts, and How Much to Add

Cet article propose un cadre statistique unifié démontrant que l'augmentation synthétique dans l'apprentissage déséquilibré n'est pas toujours bénéfique et que sa taille optimale dépend de l'alignement des erreurs du générateur, conduisant à recommander une méthode de sélection par validation (VTSS) plutôt qu'un équilibrage complet naïf.

Zhengchi Ma, Anru R. Zhang2026-03-05🤖 cs.LG

Universal Coefficients and Mayer-Vietoris Sequence for Groupoid Homology

Cet article établit la théorie de l'homologie des groupoïdes amples via le complexe de Moore à support compact, en démontrant une suite exacte courte universelle pour les coefficients discrets, en identifiant les obstructions pour les coefficients non discrets, et en construisant une suite exacte de Mayer-Vietoris pour les calculs explicites.

Luciano Melodia2026-03-05🤖 cs.LG

Rich Insights from Cheap Signals: Efficient Evaluations via Tensor Factorization

Cet article propose un modèle statistique novateur basé sur la factorisation tensorielle qui fusionne des données d'évaluation automatisées peu coûteuses avec un petit ensemble de labels humains pour permettre des évaluations fines et précises des modèles génératifs à l'échelle du prompt, tout en réduisant considérablement le besoin d'annotations humaines.

Felipe Maia Polo, Aida Nematzadeh, Virginia Aglietti + 2 more2026-03-05🤖 cs.AI

Causal Learning Should Embrace the Wisdom of the Crowd

Cet article propose un nouveau paradigme pour l'apprentissage causal qui, en intégrant le crowdsourcing, l'expertise humaine et les modèles de langage, vise à reconstruire des structures causales globales à partir des connaissances fragmentées et imparfaites d'agents distribués.

Ryan Feng Lin, Yuantao Wei, Huiling Liao + 2 more2026-03-05🤖 cs.LG

The Theory behind UMAP?

Cet article corrige les erreurs présentes dans la version originale de l'algorithme UMAP et fournit une dérivation complète et autonome des foncteurs de Spivak ainsi que de leur variante finie utilisée par McInnes et al.

David Wegmann2026-03-05🤖 cs.LG

Learning Order Forest for Qualitative-Attribute Data Clustering

Cet article propose une méthode de clustering pour les données à attributs qualitatifs, baptisée « Learning Order Forest », qui apprend conjointement une forêt d'arbres représentant les relations d'ordre locales entre les valeurs d'attributs afin d'optimiser la structure de distance pour un regroupement plus précis.

Mingjie Zhao, Sen Feng, Yiqun Zhang + 3 more2026-03-05🤖 cs.AI

Beyond Cross-Validation: Adaptive Parameter Selection for Kernel-Based Gradient Descents

Cet article propose une nouvelle stratégie de sélection de paramètres adaptative pour les descentes de gradient à noyau, fondée sur l'analyse biais-variance et la dimension effective empirique, qui garantit théoriquement des bornes d'erreur de généralisation optimales et surpassant les méthodes existantes.

Xiaotong Liu, Yunwen Lei, Xiangyu Chang + 1 more2026-03-05🤖 cs.LG

Surprisal-Rényi Free Energy

Cet article introduit l'Énergie Libre de Surprisal-Rényi (SRFE), une fonctionnelle log-momentielle qui généralise les divergences de Kullback-Leibler en révélant un compromis explicite entre moyenne et variance, tout en offrant une caractérisation variationnelle de type Gibbs et une interprétation précise en termes de Longueur Minimale de Description pour contrôler les déviations extrêmes.

Shion Matsumoto, Raul Castillo, Benjamin Prada + 1 more2026-03-05🤖 cs.LG

Scalable Contrastive Causal Discovery under Unknown Soft Interventions

Cet article propose un modèle d'apprentissage causal évolutif et contrastif capable de découvrir des structures causales sous forme de PDAG maximales à partir de régimes observationnels et interventionnels appariés avec des interventions douces inconnues, garantissant une récupération théorique et une généralisation supérieures aux méthodes existantes.

Mingxuan Zhang, Khushi Desai, Sopho Kevlishvili + 1 more2026-03-05🤖 cs.LG

Minimax Optimal Strategy for Delayed Observations in Online Reinforcement Learning

Cet article propose un algorithme combinant l'augmentation d'état et la borne de confiance supérieure pour atteindre une régression minimax optimale dans l'apprentissage par renforcement avec observations d'état retardées, en établissant à la fois une borne supérieure de regret et une borne inférieure correspondante.

Harin Lee, Kevin Jamieson2026-03-05🤖 cs.LG

Solving adversarial examples requires solving exponential misalignment

Cette étude démontre que la vulnérabilité aux exemples adversariaux découle d'un désalignement exponentiel entre les dimensions des variétés perceptuelles des réseaux de neurones et celles des concepts humains, suggérant qu'une robustesse véritable nécessite un alignement dimensionnel.

Alessandro Salvatore, Stanislav Fort, Surya Ganguli2026-03-05🤖 cs.LG

Controllable Generative Sandbox for Causal Inference

CausalMix est un cadre génératif variationnel qui comble le fossé entre le réalisme distributionnel et le contrôle causal en permettant la manipulation indépendante de l'overlap, de la force du biais de confusion et de l'hétérogénéité des effets de traitement pour valider des études d'inférence causale sur des données tabulaires mixtes.

Qi Zhang, Harsh Parikh, Ashley Naimi + 3 more2026-03-05🤖 cs.LG

Empirical Evaluation of No Free Lunch Violations in Permutation-Based Optimization

Cette étude démontre que la reformulation algébrique des objectifs et la conception des benchmarks peuvent générer des écarts locaux structurés par rapport à l'intuition du théorème « No Free Lunch », entraînant des réorganisations stables des performances des algorithmes et soulignant la nécessité d'un choix d'algorithme conscient de la classe de problèmes et de la représentation de l'objectif.

Grzegorz Sroka2026-03-05🔢 math

Extending Neural Operators: Robust Handling of Functions Beyond the Training Set

Les auteurs proposent un cadre rigoureux étendant les opérateurs neuronaux aux fonctions hors distribution en exploitant les espaces de Hilbert à noyau reproduisant pour garantir la précision des valeurs et des dérivées, méthode validée par la résolution d'équations aux dérivées partielles elliptiques sur des variétés.

Blaine Quackenbush, Paul J. Atzberger2026-03-05🤖 cs.LG

Riemannian Langevin Dynamics: Strong Convergence of Geometric Euler-Maruyama Scheme

Cet article établit la convergence forte d'ordre 1/2 d'un schéma d'Euler-Maruyama géométrique pour les équations différentielles stochastiques sur les variétés riemanniennes, fournissant ainsi une borne de Wasserstein pour l'échantillonnage via la dynamique de Langevin riemannienne.

Zhiyuan Zhan, Masashi Sugiyama2026-03-05🤖 cs.LG

A Stein Identity for q-Gaussians with Bounded Support

Cet article propose une nouvelle identité de Stein pour les distributions q-Gaussiennes à support borné, en étendant les théorèmes de Bonnet et Price via des distributions d'escorte pour obtenir des estimateurs de gradient simples et à faible variance applicables à l'apprentissage bayésien et à la minimisation de la sensibilité.

Sophia Sklaviadis, Thomas Moellenhoff, Andre F. T. Martins + 2 more2026-03-05🤖 cs.LG

Generalization Properties of Score-matching Diffusion Models for Intrinsically Low-dimensional Data

Cet article établit des bornes d'erreur d'échantillonnage fini pour les modèles de diffusion basés sur l'appariement de scores, démontrant que leur taux de convergence dépend de la dimension intrinsèque des données plutôt que de la dimension ambiante, permettant ainsi de surmonter la malédiction de la dimensionnalité sans hypothèses restrictives de support compact ou de régularité.

Saptarshi Chakraborty, Quentin Berthet, Peter L. Bartlett2026-03-05🤖 cs.AI

Inverse Contextual Bandits without Rewards: Learning from a Non-Stationary Learner via Suffix Imitation

Cet article propose un cadre d'imitation par suffixe en deux phases pour résoudre le problème des bandits contextuels inverses sans récompenses, permettant à un observateur passif de retrouver la politique optimale avec une efficacité asymptotique équivalente à celle d'un apprenant disposant des récompenses, malgré la non-stationnarité des données d'actions.

Yuqi Kong, Xiao Zhang, Weiran Shen2026-03-05🤖 cs.LG

Observationally Informed Adaptive Causal Experimental Design

Ce papier propose R-Design, un cadre d'expérimentation adaptative qui exploite les données observationnelles comme prior pour estimer les résidus de biais, démontrant théoriquement et empiriquement que cette approche est plus efficace que les essais contrôlés randomisés traditionnels qui apprennent les effets causaux à partir de zéro.

Erdun Gao, Liang Zhang, Jake Fawkes + 5 more2026-03-05🤖 cs.LG

← Précédent Suivant →