Improving reasoning at inference time via uncertainty minimisation

Este trabajo propone un método de inferencia eficiente que mejora el razonamiento de los modelos de lenguaje al seleccionar, en cada paso, la continuación que maximiza la auto-certidumbre interna del modelo, logrando un rendimiento superior a la decodificación codiciosa y comparable a la auto-consistencia con un menor coste computacional.

Nicolas Legrand, Kenneth Enevoldsen, Márton Kardos, Kristoffer Nielbo

Publicado 2026-03-10
📖 4 min de lectura☕ Lectura para el café

Each language version is independently generated for its own context, not a direct translation.

🧠 El "Sentido Común" de la Inteligencia Artificial: Cómo pensar mejor sin gastar más energía

Imagina que tienes un amigo muy inteligente, pero a veces se distrae o se equivoca en los detalles. Cuando le pides que resuelva un problema difícil de matemáticas, él empieza a hablar, pero a veces se pierde en el camino, da vueltas en círculos o se rinde antes de llegar a la solución.

Los investigadores de este paper (Nicolas, Kenneth, Márton y Kristoffer) han descubierto una forma de ayudar a este "amigo" (que es una Inteligencia Artificial o IA) a pensar mejor, sin necesidad de comprarle un cerebro más grande ni darle más horas de estudio.

1. El Problema: Pensar en "letras" vs. Pensar en "ideas"

Hasta ahora, las IAs resolvían problemas paso a paso, pero a veces se fijaban demasiado en la siguiente letra que iban a escribir. Es como si alguien intentara escribir una novela preocupándose solo por si la siguiente letra será una "a" o una "b", en lugar de pensar en la siguiente idea completa.

Esto hace que la IA se confunda con el ruido de las letras y pierda el hilo de la historia. Además, los métodos actuales para mejorarlas son muy costosos: a veces piden a la IA que escriba la misma respuesta 100 veces y eligen la más popular (como pedirle a 100 personas que resuelvan un acertijo y elegir la respuesta que más se repita). Eso gasta mucha energía y tiempo.

2. La Solución: La "Auto-Confianza" (Self-Certainty)

Los autores proponen una estrategia nueva basada en la incertidumbre. Imagina que la IA tiene un "sentimiento interno" o una brújula que le dice: "¿Qué tan seguro estoy de que esta idea es correcta?".

En lugar de mirar letra por letra, la IA ahora mira bloques de pensamiento (llamados "pensamientos" o thoughts).

  • La analogía del viaje: Imagina que la IA está planeando un viaje en coche. En lugar de decidir a cada segundo si girar a la izquierda o a la derecha basándose en un mapa borroso, se detiene en cada intersección importante (cada "pensamiento") y pregunta: "¿Estoy seguro de que este camino me lleva a la meta?".
  • El truco: Si la IA genera varias opciones para el siguiente paso, elige solo la que le hace sentir más segura internamente. Si una opción le genera dudas (incertidumbre), la descarta. Si una opción le da mucha confianza, la elige.

3. ¿Por qué funciona tan bien?

El estudio descubrió algo fascinante sobre cómo piensan estas máquinas:

  • Los buenos caminos se deciden al principio: Cuando la IA va a resolver un problema correctamente, su "sentimiento de seguridad" sube muy rápido al principio del camino. Es como si dijera: "¡Ya tengo el plan! Sé a dónde voy".
  • Los malos caminos son confusos: Cuando la IA se equivoca, su "sentimiento de seguridad" baja o se mantiene confuso durante mucho tiempo. Sigue dando vueltas, probando cosas que no encajan, como un perro olfateando sin encontrar el rastro.

La gran revelación: No hace falta revisar todo el camino. Si la IA elige los mejores pasos solo al principio (en los primeros 2 o 3 pensamientos), ya tiene casi asegurada la respuesta correcta. El resto del viaje es solo seguir ese plan.

4. Resultados Sorprendentes

  • Funciona en modelos pequeños: No necesitas una IA gigante. Incluso modelos pequeños y baratos pueden resolver problemas complejos si usan esta técnica de "elegir el pensamiento más seguro".
  • Ahorro de energía: En lugar de generar 100 respuestas completas, la IA genera solo unas pocas opciones en cada paso y elige la mejor. Es como tener un equipo de 4 personas pensando en lugar de 100.
  • Funciona en otros idiomas: Probaron esto en inglés y en danés (un idioma con menos recursos digitales). Funcionó igual de bien. Esto significa que la IA no está "memorizando" respuestas en inglés, sino que realmente está aprendiendo a pensar y a confiar en su lógica, sin importar el idioma.

En resumen

Los autores han creado una forma de enseñar a las IAs a escuchar su propia intuición.

En lugar de dejar que la IA escriba todo el texto de golpe o que escriba 100 veces lo mismo, les dicen: "Escribe 3 ideas diferentes para el siguiente paso, y elige la que te haga sentir más tranquila y segura".

Esto hace que la IA sea más rápida, más barata de usar y, lo más importante, mucho más inteligente al resolver problemas difíciles, porque aprende a concentrar su energía en los momentos donde realmente importa: el inicio del plan.

Recibe artículos como este en tu bandeja de entrada

Resúmenes diarios o semanales personalizados según tus intereses. Gists o resúmenes técnicos, en tu idioma.

Probar Digest →