SKG-Eval: Stateful Evaluation of Multi-Turn Dialogue via Incremental Semantic Knowledge Graphs
SKG-Eval est un cadre novateur et interprétable qui évalue les systèmes de dialogue multi-tours en construisant progressivement un graphe de connaissances sémantique pour détecter les incohérences et les contradictions à longue portée grâce à un suivi structuré de l'état, atteignant une corrélation plus élevée avec les jugements humains que les métriques plates ou isolées par tour existantes.