Toward Adaptive Large Language Models Structured Pruning via Hybrid-grained Weight Importance Assessment
Dit paper introduceert HyWIA, een nieuwe methode voor gestructureerde pruning van grote taalmodellen die via een hybride, adaptieve benadering zowel grof- als fijnkorrelige gewichtsbelangrijkheden combineert om prestatieverlies te minimaliseren.