MASEval: Extending Multi-Agent Evaluation from Models to Systems
Das Paper stellt MASEval vor, ein framework-agnostisches Evaluationsframework, das nachweist, dass die Wahl des Agenten-Frameworks ebenso entscheidend für die Leistung ist wie die des zugrunde liegenden Modells, und ermöglicht somit eine systemische Analyse aller Komponenten agenter Systeme.