Efficient Reasoning at Fixed Test-Time Cost via Length-Aware Attention Priors and Gain-Aware Training
Este artículo propone un enfoque de entrenamiento exclusivo que integra un prior de atención sensible a la longitud y un controlador de ganancia adaptable para mejorar el razonamiento eficiente en modelos Transformer sin incrementar los costos de tiempo de prueba.