Inference-time Alignment in Continuous Space
Dit paper introduceert Simple Energy Adaptation (SEA), een efficiënt algoritme voor inferentie-tijd uitlijning van taalmodellen dat door middel van gradiëntgebaseerde bemonstering in een continue latente ruimte direct antwoorden aanpast, waardoor het de beperkingen van discrete zoekmethodes overtreft en aanzienlijk betere prestaties levert.