MASEval: Extending Multi-Agent Evaluation from Models to Systems
Il paper presenta MASEval, un framework-agnostic che estende la valutazione dei sistemi multi-agente dall'analisi dei soli modelli a quella dell'intero sistema, dimostrando come le scelte implementative abbiano un impatto sulle prestazioni pari a quella della scelta del modello.