AgilePruner: An Empirical Study of Attention and Diversity for Adaptive Visual Token Pruning in Large Vision-Language Models
O artigo "AgilePruner" apresenta um estudo empírico que revela as limitações dos métodos de poda de tokens visuais baseados apenas em atenção ou diversidade, propondo uma estratégia adaptativa que ajusta dinamicamente a poda conforme a complexidade da imagem para melhorar a eficiência e reduzir alucinações em Modelos Grandes Visuais-Linguísticos (LVLMs).