SKG-Eval: Stateful Evaluation of Multi-Turn Dialogue via Incremental Semantic Knowledge Graphs
SKG-Eval es un marco novedoso e interpretable que evalúa sistemas de diálogo de múltiples turnos construyendo incrementalmente un Grafo de Conocimiento Semántico para detectar inconsistencias y contradicciones de largo alcance mediante el seguimiento estructurado de estados, logrando una correlación más alta con los juicios humanos que las métricas existentes planas o aisladas por turno.