SKG-Eval: Stateful Evaluation of Multi-Turn Dialogue via Incremental Semantic Knowledge Graphs
SKG-Eval é um novo framework interpretável que avalia sistemas de diálogo multi-turno construindo incrementalmente um Grafo de Conhecimento Semântico para detectar inconsistências e contradições de longo alcance por meio de rastreamento estruturado de estados, alcançando uma correlação mais alta com julgamentos humanos do que métricas existentes planas ou isoladas por turno.