Beyond ReinMax: Low-Variance Gradient Estimators for Discrete Latent Variables
Este trabalho apresenta os estimadores ReinMax-Rao e ReinMax-CV, que incorporam técnicas de Rao-Blackwellização e variáveis de controle ao método ReinMax para reduzir a variância na estimação de gradientes de variáveis latentes discretas, demonstrando desempenho superior no treinamento de autoencoders variacionais.