Efficient Reasoning at Fixed Test-Time Cost via Length-Aware Attention Priors and Gain-Aware Training
Dit paper introduceert een trainingsmethode voor Transformers die gebruikmaakt van lengtebewuste attention-priors en een gain-aware controller om de validatieprestaties te verbeteren zonder de testtijd-kosten of latentie te verhogen.