Test-Time Adaptation via Many-Shot Prompting: Benefits, Limits, and Pitfalls
Dit artikel onderzoekt de effectiviteit, beperkingen en valkuilen van testtijd-adaptatie via veel-shot prompting bij grote taalmodellen, en concludeert dat deze methode vooral nuttig is voor gestructureerde taken maar gevoelig is voor de selectiestrategie en vaak beperkt baat biedt bij open-ended generatie.