Synthetic Monitoring Environments for Reinforcement Learning

Ce papier présente les Environnements de Surveillance Synthétiques (SME), une suite infinie de tâches de contrôle continu aux politiques optimales connues, conçue pour permettre une analyse scientifique rigoureuse et transparente des algorithmes d'apprentissage par renforcement en isolant l'impact de facteurs environnementaux spécifiques sur leurs performances.

Leonard Pleiss, Carolin Schmidt, Maximilian SchifferMon, 09 Ma🤖 cs.LG

Certified and accurate computation of function space norms of deep neural networks

Cet article présente un cadre de calcul certifié et précis des normes d'espaces fonctionnelles (telles que LpL^p et Sobolev) pour les réseaux de neurones profonds, en combinant l'arithmétique par intervalles, le raffinement adaptatif et l'agrégation par quadrature afin de fournir des bornes déterministes garanties sur les résidus des PINN.

Johannes Gründler, Moritz Maibaum, Philipp PetersenMon, 09 Ma🤖 cs.LG

Geometry of Singular Foliations and Learning Manifolds in ReLU Networks via the Data Information Matrix

Cet article propose d'utiliser le Réseau de Neurones à Unités Linéaires Rectifiées (ReLU) et la Matrice d'Information des Données (DIM) pour révéler une structure de feuilletage singulier sur l'espace des données, démontrant que les points singuliers forment un ensemble de mesure nulle et que cette approche permet de mesurer les distances entre jeux de données pour le transfert de connaissances.

Eliot Tron, Rita FioresiFri, 13 Ma📊 stat

Finance-Informed Neural Network: Learning the Geometry of Option Pricing

Cet article propose FINN, un réseau de neurones auto-supervisé qui intègre la théorie financière via une réplication dynamique pour apprendre l'opérateur de tarification des options, garantissant ainsi la cohérence économique, la précision des prix et des grecques, et une adaptabilité supérieure aux modèles paramétriques traditionnels, même sur des actifs sans marché d'options.

Amine M. Aboussalah, Xuanze Li, Cheng Chi, Raj PatelFri, 13 Ma💰 q-fin

Weighted Random Dot Product Graphs

Cet article propose une extension non paramétrique du modèle de graphes à produit scalaire aléatoire (RDPG) aux graphes pondérés, permettant de distinguer des distributions de poids partageant la même moyenne mais différant par leurs moments d'ordre supérieur, tout en établissant les garanties statistiques de l'estimation des positions latentes et en fournissant un cadre pour la génération de tels graphes.

Bernardo Marenco, Paola Bermolen, Marcelo Fiori, Federico Larroca, Gonzalo MateosFri, 13 Ma📊 stat

Busemann Functions in the Wasserstein Space: Existence, Closed-Forms, and Applications to Slicing

Cet article établit l'existence et des expressions fermées des fonctions de Busemann dans l'espace de Wasserstein pour les distributions unidimensionnelles et les mesures gaussiennes, permettant ainsi de définir de nouvelles distances Sliced-Wasserstein appliquées avec succès à des problèmes d'apprentissage par transfert.

Clément Bonet, Elsa Cazelles, Lucas Drumetz, Nicolas CourtyFri, 13 Ma📊 stat

Belief Dynamics Reveal the Dual Nature of In-Context Learning and Activation Steering

Cet article propose un cadre bayésien unifié expliquant que l'apprentissage en contexte et le pilotage par activation contrôlent le comportement des grands modèles de langage en modifiant leurs croyances sur des concepts latents, respectivement par accumulation de preuves et par ajustement des priors.

Eric Bigelow, Daniel Wurgaft, YingQiao Wang, Noah Goodman, Tomer Ullman, Hidenori Tanaka, Ekdeep Singh LubanaFri, 13 Ma📊 stat

Entropic Confinement and Mode Connectivity in Overparameterized Neural Networks

Ce papier résout le paradoxe entre la connectivité des bassins d'attraction et la localisation des solutions dans les réseaux de neurones surparamétrés en démontrant que des barrières entropiques, générées par l'interaction entre les variations de courbure et le bruit de l'optimisation, confinent dynamiquement les trajectoires vers les minima malgré des chemins de perte faible.

Luca Di Carlo, Chase Goddard, David J. SchwabFri, 13 Ma📊 stat