A Component-Based Survey of Interactions between Large Language Models and Multi-Armed Bandits
Questo lavoro è il primo sondaggio che esamina sistematicamente le interazioni bidirezionali tra i grandi modelli linguistici e gli algoritmi di multi-armed bandit a livello di componente, evidenziando come questi due campi si rafforzino reciprocamente per migliorare sia il processo decisionale adattivo che le capacità dei modelli linguistici.