MASPOB: Bandit-Based Prompt Optimization for Multi-Agent Systems with Graph Neural Networks
Ce papier présente MASPOB, un cadre d'optimisation de prompts efficace en échantillons pour les systèmes multi-agents, qui combine des bandits à confiance supérieure (UCB) et des réseaux de neurones graphiques (GNN) pour surmonter les défis de coût d'évaluation, de couplage topologique et d'explosion combinatoire.