stat.ML 件の論文 | Gist.Science

Beyond ReinMax: Low-Variance Gradient Estimators for Discrete Latent Variables

本論文は、離散潜在変数を持つ機械学習モデルにおける勾配推定量の分散を低減するため、ReinMax にラオ・ブラックウェル化と制御変量法を統合した「ReinMax-Rao」と「ReinMax-CV」を提案し、変分オートエンコーダの訓練における優れた性能を実証するとともに、数値積分の観点から勾配近似の新たな解釈を提示しています。

Daniel Wang, Thang D. BuiTue, 10 Ma🤖 cs.LG

Posterior Sampling Reinforcement Learning with Gaussian Processes for Continuous Control: Sublinear Regret Bounds for Unbounded State Spaces

本論文は、状態空間が非有界である連続制御問題におけるガウス過程を用いた事後サンプリング強化学習（GP-PSRL）アルゴリズムのベイズ後悔を解析し、Borell-Tsirelson-Ibragimov-Sudakov 不等式の再帰的適用とチェイニング法を用いて、最大情報利得に依存する tight な $\widetilde{\mathcal{O}}(H^{3/2}\sqrt{\gamma_{T/H} T})$ の後悔上限を導出することで、既存理論の限界を克服したことを示しています。

Hamish Flynn, Joe Watson, Ingmar Posner, Jan PetersTue, 10 Ma🤖 cs.LG

← 前へ次へ →

stat.ML

Beyond ReinMax: Low-Variance Gradient Estimators for Discrete Latent Variables

Posterior Sampling Reinforcement Learning with Gaussian Processes for Continuous Control: Sublinear Regret Bounds for Unbounded State Spaces

Towards plausibility in time series counterfactual explanations

Unifying On- and Off-Policy Variance Reduction Methods

Beyond the Markovian Assumption: Robust Optimization via Fractional Weyl Integrals in Imbalanced Data

Efficient Credal Prediction through Decalibration

Breaking the Bias Barrier in Concave Multi-Objective Reinforcement Learning

Generative Adversarial Regression (GAR): Learning Conditional Risk Scenarios

Impact of Connectivity on Laplacian Representations in Reinforcement Learning

Momentum SVGD-EM for Accelerated Maximum Marginal Likelihood Estimation

Structural Causal Bottleneck Models

Disjunctive Branch-and-Bound for Certifiably Optimal Low-Rank Matrix Completion

Optimal Transport Aggregation for Distributed Mixture-of-Experts

Learning Robust Treatment Rules for Censored Data

Exploratory Optimal Stopping: A Singular Control Formulation

EarthquakeNPP: A Benchmark for Earthquake Forecasting with Neural Point Processes

Losing dimensions: Geometric memorization in generative diffusion

Conditional Local Importance by Quantile Expectations

Pairwise Comparisons without Stochastic Transitivity: Model, Theory and Applications

An Algorithm to perform Covariance-Adjusted Support Vector Classification in Non-Euclidean Spaces