Beyond ReinMax: Low-Variance Gradient Estimators for Discrete Latent Variables
Este trabajo introduce los estimadores de gradiente ReinMax-Rao y ReinMax-CV, que aplican técnicas de Rao-Blackwellización y variables de control al método ReinMax para reducir su varianza y mejorar el entrenamiento de autoencoders variacionales con variables latentes discretas, ofreciendo además una nueva perspectiva numérica sobre dicho enfoque.