MASQuant: Modality-Aware Smoothing Quantization for Multimodal Large Language Models
Ce papier présente MASQuant, un cadre de quantisation post-entraînement innovant pour les modèles de langage multimodaux qui résout les problèmes de désalignement de lissage et d'invariance computationnelle intermodale grâce à un lissage spécifique à la modalité et à une compensation par blanchiment SVD, garantissant ainsi des performances stables et compétitives.