CoTJudger: A Graph-Driven Framework for Automatic Evaluation of Chain-of-Thought Efficiency and Redundancy in LRMs
O artigo apresenta o CoTJudger, um framework baseado em grafos que avalia automaticamente a eficiência e a redundância do raciocínio em Modelos de Grande Raciocínio (LRMs) ao converter cadeias de pensamento em grafos de dependência para identificar o Caminho Efetivo Mais Curto (SEP), permitindo quantificar o desperdício computacional e diagnosticar falhas estruturais.