Toward Adaptive Large Language Models Structured Pruning via Hybrid-grained Weight Importance Assessment
Il paper presenta HyWIA, un metodo innovativo per la potatura strutturata dei grandi modelli linguistici che, integrando valutazioni di importanza dei pesi a granularità fine e grossolana tramite un meccanismo di attenzione adattivo, supera le tecniche esistenti mantenendo prestazioni superiori nei compiti downstream.