A Component-Based Survey of Interactions between Large Language Models and Multi-Armed Bandits
Esta encuesta presenta una revisión sistemática a nivel de componentes de la interacción bidireccional entre los modelos de lenguaje grandes y los algoritmos de banditos multi-brazo, destacando cómo se potencian mutuamente para resolver desafíos en el aprendizaje y la toma de decisiones adaptativa.