DiSCTT: Consensus-Guided Self-Curriculum for Efficient Test-Time Adaptation in Reasoning
Das Paper stellt DiSCTT vor, einen konsensgesteuerten Selbst-Lehrplan-Ansatz für die Testzeit-Adaption von Large Language Models, der durch die dynamische Zuweisung von Optimierungsstrategien basierend auf der Unsicherheit einzelner Instanzen die Effizienz und Stabilität beim Lösen von Reasoning-Aufgaben deutlich verbessert.