HiPP-Prune: Hierarchical Preference-Conditioned Structured Pruning for Vision-Language Models
Il paper presenta HiPP-Prune, un framework di pruning strutturato gerarchico condizionato dalle preferenze che ottimizza l'allocazione delle risorse nei modelli visione-linguaggio per bilanciare efficienza, utilità del compito e robustezza all'allucinazione, mitigando la degradazione della comprensione visiva attraverso segnali di sensibilità visiva e ottimizzazione multi-obiettivo.