Beyond ReinMax: Low-Variance Gradient Estimators for Discrete Latent Variables
Deze paper introduceert de ReinMax-Rao en ReinMax-CV schatters, die Rao-Blackwellisatie en controlevariatietechnieken toepassen op de ReinMax-methode om de hoge variantie bij het trainen van modellen met discrete latente variabelen te verminderen en zo de prestaties te verbeteren.