Planner Aware Path Learning in Diffusion Language Models Training
Deze paper introduceert Planner Aware Path Learning (PAPL), een nieuwe trainingsmethode voor diffusie-taalmodellen die de discrepantie tussen training en planning-gebaseerde inferentie oplost door een aangepaste P-ELBO te gebruiken, wat leidt tot aanzienlijke prestatieverbeteringen in domeinen zoals eiwitsequenties, tekstgeneratie en code.