SKG-Eval: Stateful Evaluation of Multi-Turn Dialogue via Incremental Semantic Knowledge Graphs
SKG-Eval è un nuovo framework interpretabile che valuta i sistemi di dialogo multi-turno costruendo incrementalemente un Grafo di Conoscenza Semantica per rilevare incongruenze e contraddizioni a lungo raggio tramite il tracciamento strutturato degli stati, ottenendo una correlazione più elevata con i giudizi umani rispetto alle metriche esistenti piatte o isolate per turno.