stat.ML articles | Gist.Science

SPPCSO: Adaptive Penalized Estimation Method for High-Dimensional Correlated Data

Cet article propose la méthode SPPCSO, une approche d'estimation pénalisée adaptative qui intègre la régression en composantes principales et la régularisation $L_1$ pour surmonter les défis de la multicolinéarité et du bruit élevé dans les données de haute dimension, offrant ainsi une sélection de variables stable et précise.

Ying Hu, Hu YangMon, 09 Ma🤖 cs.LG

Synthetic Monitoring Environments for Reinforcement Learning

Ce papier présente les Environnements de Surveillance Synthétiques (SME), une suite infinie de tâches de contrôle continu aux politiques optimales connues, conçue pour permettre une analyse scientifique rigoureuse et transparente des algorithmes d'apprentissage par renforcement en isolant l'impact de facteurs environnementaux spécifiques sur leurs performances.

Leonard Pleiss, Carolin Schmidt, Maximilian SchifferMon, 09 Ma🤖 cs.LG

Robust support vector model based on bounded asymmetric elastic net loss for binary classification

Cet article propose le BAEN-SVM, un modèle de classification binaire robuste basé sur une nouvelle fonction de perte asymétrique et bornée, qui surpasse les SVM classiques dans les environnements bruyants tout en offrant des garanties théoriques de robustesse et de consistance.

Haiyan Du, Hu YangMon, 09 Ma🤖 cs.LG

Certified and accurate computation of function space norms of deep neural networks

Cet article présente un cadre de calcul certifié et précis des normes d'espaces fonctionnelles (telles que $L^p$ et Sobolev) pour les réseaux de neurones profonds, en combinant l'arithmétique par intervalles, le raffinement adaptatif et l'agrégation par quadrature afin de fournir des bornes déterministes garanties sur les résidus des PINN.

Johannes Gründler, Moritz Maibaum, Philipp PetersenMon, 09 Ma🤖 cs.LG

Bayesian Additive Distribution Regression

Cet article présente DistBART, une approche bayésienne non paramétrique pour la régression de distributions qui modélise la fonction de régression à l'aide d'ensembles d'arbres de décision (BART), offrant ainsi une méthode évolutive et théoriquement fondée pour prédire des réponses scalaires à partir de prédicteurs de distributions.

Antonio R. Linero, Soumyabrata Bose, Jared MurrayMon, 09 Ma📊 stat

Semantics-Aware Caching for Concept Learning

Ce papier présente une approche de mise en cache sémantique qui réduit considérablement le temps d'exécution de l'apprentissage de concepts en Description Logique en évitant les appels redondants de récupération d'instances, tout en restant efficace pour les raisonneurs symboliques et neuro-symboliques.

Louis Mozart Kamdem Teyou, Caglar Demir, Axel-Cyrille Ngonga NgomoMon, 09 Ma🤖 cs.LG

Bounds on Representation-Induced Confounding Bias for Treatment Effect Estimation

Cet article propose un cadre de réfutation agnostique aux représentations permettant d'estimer des bornes théoriques et pratiques sur le biais de confusion induit par la réduction de dimension dans l'estimation de l'effet causal moyen conditionnel (CATE).

Valentyn Melnychuk, Dennis Frauen, Stefan FeuerriegelFri, 13 Ma📊 stat

Onflow: a model free, online portfolio allocation algorithm robust to transaction fees

L'article présente Onflow, un algorithme d'allocation de portefeuille sans modèle et en ligne basé sur l'apprentissage par renforcement et les flots de gradient, qui optimise les rendements logarithmiques tout en étant robuste aux coûts de transaction et aux risques de modèle.

Gabriel Turinici, Pierre BrugiereFri, 13 Ma💰 q-fin

Geometry of Singular Foliations and Learning Manifolds in ReLU Networks via the Data Information Matrix

Cet article propose d'utiliser le Réseau de Neurones à Unités Linéaires Rectifiées (ReLU) et la Matrice d'Information des Données (DIM) pour révéler une structure de feuilletage singulier sur l'espace des données, démontrant que les points singuliers forment un ensemble de mesure nulle et que cette approche permet de mesurer les distances entre jeux de données pour le transfert de connaissances.

Eliot Tron, Rita FioresiFri, 13 Ma📊 stat

Are Bayesian networks typically faithful?

Cet article démontre que les réseaux bayésiens fidèles constituent un ensemble ouvert et dense (donc « typique ») dans diverses classes paramétriques et non paramétriques, y compris celles avec des variables latentes, garantissant ainsi la consistance des algorithmes de découverte causale comme PC et FCI sur un ensemble de paramètres de mesure de Lebesgue pleine.

Philip Boeken, Patrick Forré, Joris M. MooijFri, 13 Ma📊 stat

Quantifying Aleatoric Uncertainty of the Treatment Effect: A Novel Orthogonal Learner

Cet article propose un nouvel apprentissage orthogonal, l'AU-learner, qui quantifie l'incertitude aléatoire de l'effet de traitement en établissant des bornes précises sur sa distribution conditionnelle via une identification partielle, comblant ainsi un vide important dans l'apprentissage automatique causal.

Valentyn Melnychuk, Stefan Feuerriegel, Mihaela van der SchaarFri, 13 Ma📊 stat

Finance-Informed Neural Network: Learning the Geometry of Option Pricing

Cet article propose FINN, un réseau de neurones auto-supervisé qui intègre la théorie financière via une réplication dynamique pour apprendre l'opérateur de tarification des options, garantissant ainsi la cohérence économique, la précision des prix et des grecques, et une adaptabilité supérieure aux modèles paramétriques traditionnels, même sur des actifs sans marché d'options.

Amine M. Aboussalah, Xuanze Li, Cheng Chi, Raj PatelFri, 13 Ma💰 q-fin

Adaptive Prior Selection in Gaussian Process Bandits with Thompson Sampling

Cet article propose deux algorithmes, PE-GP-TS et HP-GP-TS, basés sur l'échantillonnage de Thompson pour les processus gaussiens, qui sélectionnent automatiquement les priors tout en minimisant le regret dans des problèmes d'optimisation de fonctions inconnues, avec des garanties théoriques et une validation expérimentale.

Jack Sandberg, Morteza Haghir ChehreghaniFri, 13 Ma📊 stat

Weighted Random Dot Product Graphs

Cet article propose une extension non paramétrique du modèle de graphes à produit scalaire aléatoire (RDPG) aux graphes pondérés, permettant de distinguer des distributions de poids partageant la même moyenne mais différant par leurs moments d'ordre supérieur, tout en établissant les garanties statistiques de l'estimation des positions latentes et en fournissant un cadre pour la génération de tels graphes.

Bernardo Marenco, Paola Bermolen, Marcelo Fiori, Federico Larroca, Gonzalo MateosFri, 13 Ma📊 stat

Distribution estimation via Flow Matching with Lipschitz guarantees

Cet article améliore la compréhension théorique du Flow Matching en établissant des garanties de Lipschitz qui permettent de dériver un taux de convergence optimisé pour la distance de Wasserstein 1, applicable à des distributions non bornées sans hypothèse de log-concavité.

Lea KunkelFri, 13 Ma📊 stat

Busemann Functions in the Wasserstein Space: Existence, Closed-Forms, and Applications to Slicing

Cet article établit l'existence et des expressions fermées des fonctions de Busemann dans l'espace de Wasserstein pour les distributions unidimensionnelles et les mesures gaussiennes, permettant ainsi de définir de nouvelles distances Sliced-Wasserstein appliquées avec succès à des problèmes d'apprentissage par transfert.

Clément Bonet, Elsa Cazelles, Lucas Drumetz, Nicolas CourtyFri, 13 Ma📊 stat

Refereed Learning

Cet article introduit le cadre de l'apprentissage référé, où un apprenant utilise deux prouveurs concurrents pour sélectionner le meilleur modèle parmi deux boîtes noires avec une précision quasi optimale en n'interrogeant la vérité terrain qu'une seule fois, surpassant ainsi considérablement les méthodes traditionnelles à coût comparable.

Ran Canetti, Ephraim Linder, Connor WagamanFri, 13 Ma📊 stat

Belief Dynamics Reveal the Dual Nature of In-Context Learning and Activation Steering

Cet article propose un cadre bayésien unifié expliquant que l'apprentissage en contexte et le pilotage par activation contrôlent le comportement des grands modèles de langage en modifiant leurs croyances sur des concepts latents, respectivement par accumulation de preuves et par ajustement des priors.

Eric Bigelow, Daniel Wurgaft, YingQiao Wang, Noah Goodman, Tomer Ullman, Hidenori Tanaka, Ekdeep Singh LubanaFri, 13 Ma📊 stat

Approximate Bayesian inference for cumulative probit regression models

Cet article propose trois algorithmes évolutifs basés sur l'inférence variationnelle et l'expectation propagation pour approximer efficacement les distributions a posteriori dans les modèles de régression probit cumulatif, surpassant les méthodes MCMC en termes de performance computationnelle et de précision sur de grands jeux de données.

Emanuele AlivertiFri, 13 Ma📊 stat

Entropic Confinement and Mode Connectivity in Overparameterized Neural Networks

Ce papier résout le paradoxe entre la connectivité des bassins d'attraction et la localisation des solutions dans les réseaux de neurones surparamétrés en démontrant que des barrières entropiques, générées par l'interaction entre les variations de courbure et le bruit de l'optimisation, confinent dynamiquement les trajectoires vers les minima malgré des chemins de perte faible.

Luca Di Carlo, Chase Goddard, David J. SchwabFri, 13 Ma📊 stat

← Précédent Suivant →