A Voronoi Cell Formulation for Principled Token Pruning in Late-Interaction Retrieval Models
Este artigo propõe uma abordagem fundamentada na geometria do espaço de hipersféricas para o descarte de tokens em modelos de recuperação de interação tardia, formulando o problema como uma estimativa de células de Voronoi para reduzir o armazenamento do índice sem comprometer a qualidade da recuperação.