OSCAR: Online Soft Compression And Reranking
Das Paper stellt OSCAR vor, eine neuartige Online-Methode zur weichen Kompression und Neuordnung von Suchergebnissen, die die Rechenkosten von Retrieval-Augmented Generation (RAG) erheblich senkt, ohne dabei die Genauigkeit von Large Language Models zu beeinträchtigen.