Beyond ReinMax: Low-Variance Gradient Estimators for Discrete Latent Variables
Ce papier présente les estimateurs ReinMax-Rao et ReinMax-CV, qui réduisent la variance de l'estimateur ReinMax grâce à la Rao-Blackwellisation et aux variables de contrôle, améliorant ainsi l'entraînement des autoencodeurs variationnels à variables latentes discrètes.