Tiny-Critic RAG: Empowering Agentic Fallback with Parameter-Efficient Small Language Models
Il paper propone Tiny-Critic RAG, un approccio che utilizza un piccolo modello linguistico efficiente in parametri come gatekeeper per il routing binario nei sistemi RAG agentici, riducendo significativamente la latenza e i costi rispetto all'uso di grandi modelli per la valutazione.