Rescaling Confidence: What Scale Design Reveals About LLM Metacognition
Lo studio dimostra che la progettazione della scala di confidenza influisce direttamente sulla qualità dell'incertezza verbalizzata nei LLM, rivelando che scale più granulari (come 0-20) migliorano l'efficienza metacognitiva rispetto allo standard 0-100, il quale favorisce una discretizzazione eccessiva delle risposte.