CoTJudger: A Graph-Driven Framework for Automatic Evaluation of Chain-of-Thought Efficiency and Redundancy in LRMs
Die Arbeit stellt CoTJudger vor, ein graphenbasiertes Framework zur automatischen Bewertung von Large Reasoning Models, das durch die Umwandlung von Chain-of-Thought-Traces in Abhängigkeitsgraphen und die Extraktion des kürzesten effektiven Pfades redundantes Denken identifiziert und so die Recheneffizienz von der eigentlichen Lösungsqualität trennt.