The Dunning-Kruger Effect in Large Language Models: An Empirical Study of Confidence Calibration
Este estudio empírico revela que ciertos modelos de lenguaje grande exhiben un patrón análogo al efecto Dunning-Kruger, donde los modelos con menor precisión (como Kimi K2) muestran una sobreconfianza extrema en sus respuestas, mientras que los modelos más precisos (como Claude Haiku 4.5) presentan una mejor calibración de su confianza.