Diffusion Language Models Are Natively Length-Aware
Deze paper introduceert een methode waarbij Diffusie-taalmodellen de benodigde uitvoerlengte schatten op basis van de prompt, waardoor het contextvenster dynamisch kan worden ingekort voor aanzienlijke rekenefficiëntie zonder prestatieverlies.