Toward Adaptive Large Language Models Structured Pruning via Hybrid-grained Weight Importance Assessment
Cet article propose HyWIA, une méthode innovante de pruning structuré pour les grands modèles de langage qui fusionne de manière adaptative des évaluations d'importance des poids à granularité fine et grossière pour améliorer la rétention des performances lors de la compression.