Beyond ReinMax: Low-Variance Gradient Estimators for Discrete Latent Variables
Diese Arbeit stellt die ReinMax-Rao- und ReinMax-CV-Schätzer vor, die Rao-Blackwellisierung und Kontrollvariablen nutzen, um die hohe Varianz des ReinMax-Algorithmus für diskrete latente Variablen zu reduzieren und so das Training von Variational Autoencodern zu verbessern.