Quantifying the Necessity of Chain of Thought through Opaque Serial Depth
Este artículo formaliza el concepto de "profundidad serial opaca" para cuantificar la capacidad de los modelos de lenguaje de realizar razonamiento interno sin pasos intermedios interpretables, estableciendo límites superiores para arquitecturas como Gemma 3 y demostrando que los modelos de mezcla de expertos probablemente poseen una profundidad menor que los modelos densos.