Query-focused and Memory-aware Reranker for Long Context Processing
Este artigo propõe um reranker leve e eficiente baseado em atenção que utiliza pontuações de relevância contínuas para superar os métodos atuais no processamento de contextos longos e benchmarks de memória, alcançando resultados state-of-the-art com modelos de pequeno porte.