MASQuant: Modality-Aware Smoothing Quantization for Multimodal Large Language Models
Il paper presenta MASQuant, un nuovo framework di quantizzazione post-allenamento che risolve le sfide di allineamento e invarianza computazionale nei modelli linguistici multimodali attraverso una tecnica di smoothing consapevole della modalità e una compensazione incrociata basata sulla decomposizione SVD.