stat.ML articles | Gist.Science

Invariance-Based Dynamic Regret Minimization

Cet article propose l'algorithme ISD-linUCB pour les bandits linéaires stochastiques non stationnaires, qui améliore la minimisation du regret dynamique en exploitant les données historiques pour identifier et tirer parti des invariances dans la décomposition stationnaire et non stationnaire du modèle de récompense.

Margherita Lazzaretto, Jonas Peters, Niklas Pfister2026-03-05🤖 cs.LG

Hierarchical Inference and Closure Learning via Adaptive Surrogates for ODEs and PDEs

Cet article propose une méthodologie hiérarchique bayésienne combinant des inférences adaptatives, des modèles de fermeture basés sur l'apprentissage automatique et des stratégies d'optimisation bi-niveau avec des substituts (FNO et PINN) pour résoudre simultanément les problèmes inverses et apprendre les dynamiques inconnues dans des systèmes ODE et PDE à partir de données hétérogènes.

Pengyu Zhang, Arnaud Vadeboncoeur, Alex Glyn-Davies + 1 more2026-03-05🤖 cs.LG

Fixed-Budget Constrained Best Arm Identification in Grouped Bandits

Cet article propose l'algorithme FCSR pour identifier, sous contrainte de budget fixe, le meilleur bras dans un cadre de bandits groupés où la faisabilité exige que tous les attributs dépassent un seuil donné, en démontrant théoriquement et empiriquement son optimalité et sa supériorité par rapport aux méthodes existantes.

Raunak Mukherjee, Sharayu Moharir2026-03-05🤖 cs.LG

Exploiting Subgradient Sparsity in Max-Plus Neural Networks

Cet article propose un algorithme de sous-gradient épars qui exploite la structure algébrique des réseaux de neurones Max-Plus pour optimiser efficacement la perte du pire échantillon, surmontant ainsi les limitations de la rétropropagation standard dans ce contexte non lisse.

Ikhlas Enaieh, Olivier Fercoq2026-03-05🤖 cs.LG

Stable and Steerable Sparse Autoencoders with Weight Regularization

En introduisant une régularisation L2 des poids dans les autoencodeurs parcimonieux, cette étude démontre une amélioration significative de la stabilité des caractéristiques apprises et de l'efficacité du pilotage (steering) des modèles de langage, tout en renforçant la corrélation entre les explications sémantiques et le contrôle fonctionnel.

Piotr Jedryszek, Oliver M. Crook2026-03-05🤖 cs.LG

Beyond Mixtures and Products for Ensemble Aggregation: A Likelihood Perspective on Generalized Means

Cet article propose une justification théorique fondée sur la vraisemblance pour l'agrégation d'ensembles via les moyennes généralisées, démontrant que seules les configurations d'ordre $r \in [0,1]$ garantissent systématiquement une amélioration par rapport aux distributions individuelles, ce qui valide ainsi les pratiques courantes de pooling linéaire et géométrique.

Raphaël Razafindralambo, Rémy Sun, Frédéric Precioso + 2 more2026-03-05🤖 cs.LG

Semi-Supervised Generative Learning via Latent Space Distribution Matching

Cet article présente le cadre LSDM, une méthode d'apprentissage génératif semi-supervisé qui améliore la qualité et la fidélité géométrique des images générées en apprenant un espace latent à partir de données appariées et non appariées avant d'y effectuer un appariement de distributions, tout en offrant une perspective théorique unifiée reliant cette approche aux modèles de diffusion latents.

Kwong Yu Chong, Long Feng2026-03-05🤖 cs.LG

PTOPOFL: Privacy-Preserving Personalised Federated Learning via Persistent Homology

Le papier présente PTOPOFL, un cadre d'apprentissage fédéré personnalisé qui remplace l'échange de gradients par des descripteurs topologiques issus de l'homologie persistante pour garantir une confidentialité accrue et améliorer la convergence dans des environnements de données non indépendants et non identiquement distribués (non-IID).

Kelly L Vomo-Donfack, Adryel Hoszu, Grégory Ginot + 1 more2026-03-05🤖 cs.LG

From Reachability to Learnability: Geometric Design Principles for Quantum Neural Networks

Cet article propose des principes de conception géométrique pour les réseaux de neurones quantiques en redéfinissant l'apprenabilité non pas comme une simple atteignabilité des états, mais comme une géométrie contrôlable des représentations cachées nécessitant une dépendance conjointe aux données et aux poids via le critère de sélectivité locale presque complète (aCLS).

Vishal S. Ngairangbam, Michael Spannowsky2026-03-03⚛️ quant-ph

Denoising Diffusion Probabilistic Models

Cette présentation de modèles de diffusion probabilistes pour la synthèse d'images atteint des performances de pointe sur CIFAR10 et LSUN en s'appuyant sur une nouvelle connexion théorique entre ces modèles et le score matching avec dynamique de Langevin.

Jonathan Ho, Ajay Jain, Pieter Abbeel2020-06-19🤖 cs.LG

Scaling Laws for Neural Language Models

Cette étude établit des lois d'échelle empiriques montrant que la performance des modèles de langage suit une loi de puissance par rapport à leur taille, la taille des données et le calcul, révélant qu'il est optimal d'entraîner des modèles très grands sur des quantités de données modérées en s'arrêtant bien avant la convergence pour maximiser l'efficacité.

Jared Kaplan, Sam McCandlish, Tom Henighan + 7 more2020-01-23🤖 cs.LG

Generative Adversarial Networks

Ce papier propose un nouveau cadre d'estimation de modèles génératifs basé sur un processus adversarial où un modèle générateur et un modèle discriminateur sont entraînés simultanément via un jeu minimax, permettant de générer des échantillons réalistes sans recourir à des chaînes de Markov ou à des réseaux d'inférence approchée.

Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza + 5 more2014-06-10📊 stat.ML

Auto-Encoding Variational Bayes

Cet article présente un algorithme d'inférence variationnelle stochastique scalable, basé sur une reparamétrisation du bound inférieur et un modèle d'inférence approximative, permettant un apprentissage efficace de modèles probabilistes dirigés avec des variables latentes continues et des ensembles de données massifs.

Diederik P Kingma, Max Welling2013-12-20📊 stat.ML

← Précédent