Efficiently Aligning Draft Models via Parameter- and Data-Efficient Adaptation
Dit paper introduceert EDA, een parameter- en data-efficiënt framework dat de prestaties van speculatieve decoding op fijngetrainde LLM's herstelt door een ontkoppelde architectuur, data-regeneratie en selectieve steekproefneming te combineren, waardoor volledige hertraining overbodig wordt.