Eliciting Numerical Predictive Distributions of LLMs Without Autoregression

Este trabajo demuestra que es posible recuperar las propiedades distribucionales y la incertidumbre numérica de las predicciones de los Modelos de Lenguaje Grandes (LLMs) directamente a partir de sus representaciones internas mediante sondas de regresión, ofreciendo así una alternativa eficiente y sin generación autoregresiva a los costosos métodos de muestreo.

Julianna Piskorz, Katarzyna Kobalczyk, Mihaela van der Schaar

Publicado 2026-03-04
📖 4 min de lectura☕ Lectura para el café

Each language version is independently generated for its own context, not a direct translation.

¡Claro que sí! Imagina que tienes a un genio muy inteligente (un Modelo de Lenguaje Grande o LLM) que es excelente escribiendo historias, pero cuando le pides que adivine un número futuro (como la temperatura de mañana o el precio de una acción), se comporta de una manera muy peculiar y costosa.

Aquí te explico la idea central de este paper como si fuera una historia:

🎭 El Problema: El Genio que "Habla" en Pasos

Imagina que le preguntas al genio: "¿Qué número saldrá en el próximo turno?".
Normalmente, el genio no te da el número de golpe. Tiene que "pensar" palabra por palabra (o más bien, token por token).

  • Primero dice: "El número es..."
  • Luego: "...un..."
  • Luego: "...dos..."
  • Luego: "...punto..."
  • Luego: "...cinco..."

Para que el genio te diga un número completo, tiene que pasar por este proceso lento y repetitivo muchas veces. Si quieres saber qué tan seguro está el genio (su incertidumbre), tienes que pedirle que repita este proceso 100 veces para ver si siempre dice "2.5" o si a veces dice "2.4" y otras "2.6". Esto es como pedirle a un chef que cocine 100 platos idénticos solo para ver si la sal está bien puesta; cuesta mucho tiempo y recursos.

🔍 La Solución: El "Rayo X" del Cerebro

Los autores de este paper se preguntaron: "¿Es necesario esperar a que el genio escriba todo el número para saber qué va a decir?".

Su respuesta es un rotundo NO.

Descubrieron que, antes de que el genio empiece a escribir la primera palabra, su "cerebro" (sus representaciones internas o hidden states) ya tiene toda la información necesaria. Es como si el genio ya hubiera decidido el número en su mente, pero solo se ve obligado a escribirlo paso a paso por reglas antiguas.

🛠️ La Herramienta: El "Detective de Números"

Para probar esto, crearon un pequeño detective llamado "Sonda" (o probe).

  1. El Truco: En lugar de esperar a que el genio escriba el número, el detective mira directamente la "mente" del genio justo después de leer los datos.
  2. La Magia (Descomposición): Los números son difíciles porque pueden ser muy pequeños (0.001) o gigantes (1,000,000). El detective usa un truco inteligente:
    • Primero, adivina el tamaño del número (¿es de miles? ¿de millones?). Esto es como adivinar si el regalo es una caja de zapatos o un mueble.
    • Segundo, adivina el valor exacto dentro de ese tamaño.
    • Al separar estas dos tareas, el detective puede acertar números de cualquier tamaño sin confundirse.

🎲 ¿Y la Incertidumbre? (El "Miedo" del Genio)

Lo más impresionante es que el detective no solo adivina el número, sino que también puede decirte qué tan seguro está el genio.

  • Si el genio está muy seguro, el detective dirá: "Va a salir un 5, y estoy 99% seguro".
  • Si el genio está dudando, el detective dirá: "Podría ser un 4 o un 6, hay mucha variación".

Antes, para saber esto, tenías que hacerle al genio 100 preguntas (muestreo). Ahora, el detective mira la mente una sola vez y te da el rango de seguridad. ¡Es como leer la intención de alguien en su cara en lugar de hacerle 100 preguntas para ver si miente!

🚀 ¿Por qué es esto un superpoder?

  1. Velocidad: En lugar de esperar 10 segundos para que el genio "escriba" el número 100 veces, el detective lo hace en una fracción de segundo.
  2. Ahorro: Ahorra una cantidad enorme de energía y dinero en computación.
  3. Confianza: Nos permite usar estos modelos inteligentes en situaciones donde necesitamos saber el riesgo (como en medicina o finanzas) sin tener que esperar horas.

En resumen

Este paper nos dice que los modelos de IA ya "saben" los números antes de hablarlos. Solo necesitamos aprender a leer sus pensamientos internos (sus representaciones ocultas) en lugar de esperar a que escriban la respuesta letra por letra. Es como pasar de esperar a que un cartero entregue 100 cartas para entender el mensaje, a simplemente leer el sobre y saber exactamente qué hay dentro.

¡Es una forma más rápida, barata y eficiente de usar la inteligencia artificial para predecir el futuro! 🔮✨

Recibe artículos como este en tu bandeja de entrada

Resúmenes diarios o semanales personalizados según tus intereses. Gists o resúmenes técnicos, en tu idioma.

Probar Digest →