stat.ML 편의 논문 | Gist.Science

Beyond ReinMax: Low-Variance Gradient Estimators for Discrete Latent Variables

이 논문은 ReinMax 추정기의 높은 분산을 Rao-Blackwellisation 및 제어 변수 기법을 통해 개선한 ReinMax-Rao 와 ReinMax-CV 추정기를 제안하고, 이를 통해 이산 잠재 변수를 가진 변이 오토인코더의 학습 성능을 향상시켰음을 보여줍니다.

Daniel Wang, Thang D. BuiTue, 10 Ma🤖 cs.LG

Posterior Sampling Reinforcement Learning with Gaussian Processes for Continuous Control: Sublinear Regret Bounds for Unbounded State Spaces

이 논문은 비구속 상태 공간에서 가우시안 프로세스 사후 샘플링 강화 학습 (GP-PSRL) 알고리즘의 베이지안 후회 상한을 유도하여, 최대 정보 획득량에 대한 최적의 의존성과 비구속 상태 공간의 문제를 해결하고 기존 이론적 한계를 극복했습니다.

Hamish Flynn, Joe Watson, Ingmar Posner, Jan PetersTue, 10 Ma🤖 cs.LG

← 이전 다음 →

stat.ML

Beyond ReinMax: Low-Variance Gradient Estimators for Discrete Latent Variables

Posterior Sampling Reinforcement Learning with Gaussian Processes for Continuous Control: Sublinear Regret Bounds for Unbounded State Spaces

Towards plausibility in time series counterfactual explanations

Unifying On- and Off-Policy Variance Reduction Methods

Beyond the Markovian Assumption: Robust Optimization via Fractional Weyl Integrals in Imbalanced Data

Efficient Credal Prediction through Decalibration

Breaking the Bias Barrier in Concave Multi-Objective Reinforcement Learning

Generative Adversarial Regression (GAR): Learning Conditional Risk Scenarios

Impact of Connectivity on Laplacian Representations in Reinforcement Learning

Momentum SVGD-EM for Accelerated Maximum Marginal Likelihood Estimation

Structural Causal Bottleneck Models

Disjunctive Branch-and-Bound for Certifiably Optimal Low-Rank Matrix Completion

Optimal Transport Aggregation for Distributed Mixture-of-Experts

Learning Robust Treatment Rules for Censored Data

Exploratory Optimal Stopping: A Singular Control Formulation

EarthquakeNPP: A Benchmark for Earthquake Forecasting with Neural Point Processes

Losing dimensions: Geometric memorization in generative diffusion

Conditional Local Importance by Quantile Expectations

Pairwise Comparisons without Stochastic Transitivity: Model, Theory and Applications

An Algorithm to perform Covariance-Adjusted Support Vector Classification in Non-Euclidean Spaces