DiSCTT: Consensus-Guided Self-Curriculum for Efficient Test-Time Adaptation in Reasoning
O artigo apresenta o DiSCTT, um framework de auto-curriculum guiado por consenso que melhora a eficiência e a estabilidade da adaptação em tempo de teste para modelos de raciocínio ao atribuir dinamicamente estratégias de otimização baseadas na incerteza epistêmica e no nível de acordo entre trajetórias de raciocínio amostradas.