Best-of- -- Asymptotic Performance of Test-Time LLM Ensembling
Dit onderzoek analyseert de asymptotische prestaties van best-of- ensembling met meerderheidsstemming voor grote taalmodellen, introduceert een adaptief generatieschema om de inferentiekosten te optimaliseren en toont aan dat gewogen ensembles van meerdere modellen via een gemengd-geheelgetallig lineair programma superieure resultaten kunnen behalen.