Graph2Eval: Automatic Multimodal Task Generation for Agents via Knowledge Graphs
El artículo presenta Graph2Eval, un marco impulsado por grafos de conocimiento que genera automáticamente tareas multimodales escalables y semánticamente consistentes para evaluar agentes, superando las limitaciones de los conjuntos de datos estáticos y los problemas de alucinación de los LLM mediante un proceso de muestreo y filtrado riguroso.