MASQuant: Modality-Aware Smoothing Quantization for Multimodal Large Language Models
Die Arbeit stellt MASQuant vor, ein neues Post-Training-Quantisierungs-Framework für multimodale große Sprachmodelle, das durch modalspezifische Glättungsfaktoren und eine SVD-basierte Kompensation die Herausforderungen der Glättungsfehlausrichtung und der rechnerischen Invarianz zwischen verschiedenen Modalitäten effektiv löst.