Planner Aware Path Learning in Diffusion Language Models Training
Este artigo apresenta o Planner Aware Path Learning (PAPL), um novo esquema de treinamento que deriva uma nova evidência inferior planejada (P-ELBO) para alinhar o treinamento e a inferência em modelos de difusão de linguagem, corrigindo a incompatibilidade causada por estratégias de planejamento e resultando em melhorias significativas na geração de texto, código e sequências de proteínas.