CoTJudger: A Graph-Driven Framework for Automatic Evaluation of Chain-of-Thought Efficiency and Redundancy in LRMs
El artículo presenta CoTJudger, un marco basado en grafos que evalúa automáticamente la eficiencia y la redundancia en los modelos de razonamiento a gran escala (LRMs) al convertir las cadenas de pensamiento en grafos de dependencia para identificar la ruta más corta necesaria para la solución correcta.