Test-Time Adaptation via Many-Shot Prompting: Benefits, Limits, and Pitfalls
Questo studio empirico analizza l'efficacia e i limiti del prompting many-shot come strategia di adattamento a tempo di test per i modelli linguistici, rivelando che mentre funziona bene per compiti strutturati ad alto guadagno informativo, è spesso sensibile alla selezione degli esempi e poco vantaggioso per la generazione aperta.