RACER: Risk-Aware Calibrated Efficient Routing for Large Language Models
Die Arbeit stellt RACER vor, einen risikobewussten, kalibrierten und effizienten Router für große Sprachmodelle, der durch die Formulierung des Routing-Problems als -VOR-Problem und die Ausgabe aggregierbarer Modellsätze eine verteilungsunabhängige Risikokontrolle bei gleichzeitiger Verbesserung der Genauigkeit gewährleistet.