Rescaling Confidence: What Scale Design Reveals About LLM Metacognition
El estudio demuestra que el diseño de la escala de confianza verbalizada en los modelos de lenguaje (LLM) no es neutral y que utilizar un rango de 0 a 20 mejora significativamente la eficiencia metacognitiva en comparación con el formato estándar de 0 a 100, el cual sufre de una fuerte discretización hacia números redondos.