Beyond Scattered Acceptance: Fast and Coherent Inference for DLMs via Longest Stable Prefixes
Ce papier présente le planificateur LSP (Longest Stable Prefix), une méthode d'inférence sans entraînement pour les modèles de langage par diffusion qui accélère la génération de texte jusqu'à 3,4 fois en remplaçant l'acceptation fragmentée par l'absorption monolithique de préfixes stables, optimisant ainsi la localité mémoire et la cohérence linguistique.