EvoPrune: Early-Stage Visual Token Pruning for Efficient MLLMs
O artigo apresenta o EvoPrune, um método de poda de tokens visuais em estágios iniciais que otimiza a eficiência de modelos multimodais grandes (MLLMs) ao reduzir o custo computacional durante a codificação visual, alcançando um aumento de duas vezes na velocidade de inferência com degradação mínima de desempenho.