MASQuant: Modality-Aware Smoothing Quantization for Multimodal Large Language Models
O artigo apresenta o MASQuant, um novo framework de quantização pós-treinamento para Modelos de Linguagem Multimodais (MLLMs) que resolve problemas de desalinhamento e invariância computacional entre modalidades através de suavização específica por modalidade e compensação baseada em SVD, alcançando desempenho competitivo em modelos duais e tri-ais.