Query-focused and Memory-aware Reranker for Long Context Processing
Il paper propone un framework di reranking leggero e memory-aware che utilizza i punteggi di attenzione di modelli di piccole dimensioni per stimare la rilevanza tra query e passaggi, ottenendo risultati all'avanguardia su benchmark di contesti lunghi e comprensione del dialogo.