stat.ML articles | Gist.Science

Beyond ReinMax: Low-Variance Gradient Estimators for Discrete Latent Variables

Ce papier présente les estimateurs ReinMax-Rao et ReinMax-CV, qui réduisent la variance de l'estimateur ReinMax grâce à la Rao-Blackwellisation et aux variables de contrôle, améliorant ainsi l'entraînement des autoencodeurs variationnels à variables latentes discrètes.

Daniel Wang, Thang D. BuiTue, 10 Ma🤖 cs.LG

Posterior Sampling Reinforcement Learning with Gaussian Processes for Continuous Control: Sublinear Regret Bounds for Unbounded State Spaces

Cet article établit des bornes de regret bayésien sous-linéaires pour l'algorithme de rétroéchantillonnage de Gaussien (GP-PSRL) dans des espaces d'états continus et non bornés, en démontrant que les états visités restent confinés dans une boule de rayon quasi constant et en obtenant une dépendance optimale par rapport au gain d'information maximal grâce à la méthode de chaînage.

Hamish Flynn, Joe Watson, Ingmar Posner, Jan PetersTue, 10 Ma🤖 cs.LG

Towards plausibility in time series counterfactual explanations

Cet article présente une nouvelle méthode d'optimisation par gradient pour générer des explications contrefactuelles plausibles en classification de séries temporelles, en intégrant une contrainte d'alignement soft-DTW avec les voisins les plus proches pour garantir une structure temporelle réaliste tout en surpassant les approches existantes.

Marcin Kostrzewa, Krzysztof Galus, Maciej Zi\k{e}baTue, 10 Ma🤖 cs.LG

Unifying On- and Off-Policy Variance Reduction Methods

Ce papier établit une équivalence formelle entre les méthodes de réduction de variance utilisées dans les tests A/B en ligne et l'évaluation hors politique, démontrant que l'estimateur de différence de moyennes correspond à un score de propension inverse avec un variate de contrôle optimal, et que les ajustements par régression sont structurellement équivalents à l'estimation doublement robuste.

Olivier JeunenTue, 10 Ma🤖 cs.LG

Beyond the Markovian Assumption: Robust Optimization via Fractional Weyl Integrals in Imbalanced Data

Cet article propose un nouvel algorithme d'optimisation fondé sur le calcul fractionnaire, utilisant l'intégrale de Weyl pondérée pour remplacer les mises à jour de poids markoviennes par une mémoire historique dynamique, ce qui améliore considérablement la robustesse et les performances sur des données déséquilibrées comme la détection de fraude financière.

Gustavo A. DorregoTue, 10 Ma🤖 cs.LG

Efficient Credal Prediction through Decalibration

Cet article propose une méthode efficace de prédiction crédale fondée sur la décalibration, permettant de représenter l'incertitude épistémique via des intervalles de probabilité sans nécessiter le réentraînement coûteux d'ensembles de modèles, rendant ainsi cette approche applicable à des architectures complexes comme TabPFN et CLIP.

Paul Hofman, Timo Löhr, Maximilian Muschalik, Yusuf Sale, Eyke HüllermeierTue, 10 Ma🤖 cs.LG

Breaking the Bias Barrier in Concave Multi-Objective Reinforcement Learning

Cet article propose un algorithme de gradient de politique naturelle combiné à un estimateur Monte Carlo multiniveau pour surmonter le biais inhérent à la scalarisation concave dans l'apprentissage par renforcement multi-objectif, permettant ainsi d'atteindre une complexité d'échantillonnage optimale de $\widetilde{\mathcal{O}}(\epsilon^{-2})$ .

Swetha Ganesh, Vaneet AggarwalTue, 10 Ma🤖 cs.LG

Generative Adversarial Regression (GAR): Learning Conditional Risk Scenarios

Le papier propose le cadre de régression générative antagoniste (GAR), qui apprend des scénarios de risque conditionnels en alignant les générateurs sur des objectifs de risque élicitables via une formulation minimax, démontrant ainsi une meilleure préservation du risque en aval sur les données du S&P 500 par rapport aux méthodes existantes.

Saeed Asadi, Jonathan Yu-Meng LiTue, 10 Ma🤖 cs.LG

Impact of Connectivity on Laplacian Representations in Reinforcement Learning

Cet article établit des bornes d'erreur théoriques reliant la qualité des représentations d'état apprises via les vecteurs propres du Laplacien en apprentissage par renforcement à l'connectivité algébrique du graphe de transition, tout en offrant une formulation clarifiée de l'opérateur Laplacien applicable à des politiques générales.

Tommaso Giorgi, Pierriccardo Olivieri, Keyue Jiang, Laura Toni, Matteo PapiniTue, 10 Ma🤖 cs.LG

Momentum SVGD-EM for Accelerated Maximum Marginal Likelihood Estimation

Ce papier propose une version accélérée de l'algorithme SVGD-EM, baptisée Momentum SVGD-EM, qui intègre l'accélération de Nesterov dans les mises à jour des paramètres et des mesures de probabilité pour améliorer la convergence de l'estimation du maximum de vraisemblance marginale.

Adam Rozzio, Rafael Athanasiades, O. Deniz AkyildizTue, 10 Ma🤖 cs.LG

Structural Causal Bottleneck Models

Cet article introduit les modèles de goulot d'étranglement causaux structurels (SCBMs), une nouvelle classe de modèles causaux qui postulent que les effets entre variables de haute dimension dépendent uniquement de statistiques résumées de basse dimension, offrant ainsi un cadre flexible pour la réduction de dimension et l'estimation d'effets dans des contextes de transfert à faible échantillonnage.

Simon Bing, Jonas Wahl, Jakob RungeTue, 10 Ma🤖 cs.LG

Disjunctive Branch-and-Bound for Certifiably Optimal Low-Rank Matrix Completion

Cet article propose une méthode de branch-and-bound disjonctive couplée à de nouvelles relaxations convexes pour résoudre le problème de complétion de matrices de faible rang avec une garantie d'optimalité, surpassant significativement les heuristiques existantes en termes de précision et de certitude théorique.

Dimitris Bertsimas, Ryan Cory-Wright, Sean Lo, Jean PauphiletThu, 12 Ma📊 stat

Optimal Transport Aggregation for Distributed Mixture-of-Experts

Cet article propose une méthode d'agrégation de modèles de mélanges d'experts distribués basée sur le transport optimal, qui permet de reconstruire un estimateur global cohérent avec une seule étape de communication tout en garantissant des performances comparables à un entraînement centralisé.

Faïcel Chamroukhi, Nhat Thien PhamThu, 12 Ma📊 stat

Learning Robust Treatment Rules for Censored Data

Cet article propose deux critères robustes et un algorithme d'optimisation pour apprendre des règles de traitement optimales dans le contexte de données de survie censurées, en visant à maximiser le temps de survie tronqué et les probabilités de survie tamponnées, tout en validant ces méthodes par des simulations et une application sur des données cliniques du sida.

Yifan Cui, Junyi Liu, Tao Shen, Zhengling Qi, Xi ChenThu, 12 Ma📊 stat

Exploratory Optimal Stopping: A Singular Control Formulation

Cet article propose une formulation en contrôle singulier régularisé par l'entropie résiduelle pour les problèmes d'arrêt optimal exploratoires, permettant d'identifier une stratégie optimale unique et de développer des algorithmes d'apprentissage par renforcement, notamment de type acteur-critique, capables de gérer des dimensions élevées.

Jodi Dianetti, Giorgio Ferrari, Renyuan XuThu, 12 Ma💰 q-fin

EarthquakeNPP: A Benchmark for Earthquake Forecasting with Neural Point Processes

Ce papier présente EarthquakeNPP, une nouvelle plateforme de benchmarking qui corrige les failles des évaluations précédentes et démontre que, contrairement aux attentes, les processus ponctuels neuronaux actuels ne surpassent pas le modèle sismologique classique ETAS pour la prévision des tremblements de terre.

Samuel Stockman, Daniel Lawson, Maximilian WernerThu, 12 Ma🔬 physics

Losing dimensions: Geometric memorization in generative diffusion

Cette étude propose une théorie de la mémorisation géométrique démontrant que, face à la rareté des données, les modèles de diffusion subissent un effondrement progressif de leur capacité variationnelle où les caractéristiques saillantes puis les détails fins se figent, menant à une réplication quasi ponctuelle des exemples d'entraînement.

Beatrice Achilli, Enrico Ventura, Gianluigi Silvestri, Bao Pham, Gabriel Raya, Dmitry Krotov, Carlo Lucibello, Luca AmbrogioniThu, 12 Ma📊 stat

Conditional Local Importance by Quantile Expectations

Ce papier propose CLIQUE, une nouvelle méthode agnostique au modèle pour calculer l'importance locale des variables, qui améliore les techniques existantes comme LIME et SHAP en capturant les dépendances locales et les interactions complexes tout en s'adaptant nativement aux problèmes de classification multi-classes.

Kelvyn K. Bladen, Adele Cutler, D. Richard Cutler, Kevin R. MoonThu, 12 Ma📊 stat

Pairwise Comparisons without Stochastic Transitivity: Model, Theory and Applications

Cet article propose une nouvelle famille de modèles statistiques pour les comparaisons par paires qui se passe de l'hypothèse de transitivité stochastique, en utilisant une matrice antisymétrique de faible dimension pour capturer des dynamiques complexes et offrir une estimation optimale même avec des données éparses.

Sze Ming Lee, Yunxiao ChenThu, 12 Ma📊 stat

An Algorithm to perform Covariance-Adjusted Support Vector Classification in Non-Euclidean Spaces

Cette étude propose un algorithme de classification SVM ajusté par la covariance utilisant la décomposition de Cholesky pour surmonter les limitations des méthodes traditionnelles dans les espaces non-euclidiens, démontrant ainsi des performances supérieures en termes de précision et de robustesse par rapport aux SVM classiques.

Satyajeet Sahoo, Jhareswar MaitiThu, 12 Ma📊 stat

← Précédent Suivant →