EvoPrune: Early-Stage Visual Token Pruning for Efficient MLLMs
Il paper presenta EvoPrune, un metodo di pruning dei token visivi eseguito durante la fase di codifica nei MLLM che, riducendo i costi computazionali, garantisce un raddoppio della velocità di inferenza con una minima perdita di prestazioni.