Stopping Computation for Converged Tokens in Masked Diffusion-LM Decoding
Het paper introduceert SureLock, een methode die de rekenkosten van Masked Diffusion-LM-decodering aanzienlijk verlaagt door tokens die al zijn geconvergeerd te vergrendelen en hun bijdrage aan de berekening over te slaan, terwijl hun context voor andere tokens behouden blijft.