Best-of- -- Asymptotic Performance of Test-Time LLM Ensembling
Die Arbeit untersucht die asymptotische Leistung von Best-of--Ensembles für Large Language Models bei unendlicher Stichprobengröße und schlägt einen adaptiven, gewichteten Ansatz vor, der die Inferenzkosten effizient steuert und durch optimale Modellkombinationen die Leistung einzelner Modelle übertrifft.