Draft-Conditioned Constrained Decoding for Structured Generation in LLMs
O artigo propõe a Decodificação Condição-Rascunho (DCCD), um método de inferência sem treinamento que separa o planejamento semântico da validação estrutural para gerar saídas válidas em LLMs, resultando em ganhos significativos de precisão e eficiência de parâmetros em comparação com a decodificação restrita padrão.