LINGOLY-TOO: Disentangling Reasoning from Knowledge with Templatised Orthographic Obfuscation

El artículo presenta LINGOLY-TOO, un nuevo conjunto de datos de 1.203 problemas de olimpiada lingüística con obfuscaciones ortográficas diseñadas para desvincular el razonamiento de la memorización y revelar que incluso los modelos más avanzados dependen en gran medida de conocimientos previos en lugar de un razonamiento genuino.

Jude Khouja, Lingyi Yang, Karolina Korgul, Simeon Hellsten, Vlad A. Neacsu, Harry Mayne, Ryan Othniel Kearns, Andrew M. Bean, Adam Mahdi

Publicado 2026-03-04
📖 4 min de lectura☕ Lectura para el café

Each language version is independently generated for its own context, not a direct translation.

¡Claro que sí! Imagina que los modelos de inteligencia artificial (como los que chatean contigo) son como estudiantes superdotados que han leído casi todo lo que existe en internet. Tienen una memoria increíble, pero a veces, en lugar de pensar para resolver un problema, simplemente recuerdan la respuesta porque ya la han visto antes.

Este paper, llamado LINGOLY-TOO, es como un examen de "trampa" diseñado por lingüistas para ver si esos estudiantes realmente saben razonar o si solo están memorizando.

Aquí te lo explico con una analogía sencilla:

1. El Problema: El Estudiante que "Adivina" en lugar de "Pensar"

Imagina que le pones a un estudiante un acertijo de lógica sobre un idioma que no conoce (digamos, el idioma de una tribu lejana).

  • La forma normal: Si el acertijo está escrito en letras normales, el estudiante podría decir: "¡Ah! Ya he visto este idioma antes en internet, sé que la palabra 'perro' se dice así". Y da la respuesta correcta, pero no porque haya razonado, sino porque lo sabía de memoria.
  • El resultado: Los expertos dicen: "¡Mira qué listo es!". Pero en realidad, solo está usando su memoria, no su cerebro para pensar.

2. La Solución: El "Disfraz" (Obfuscación)

Los autores de este paper crearon LINGOLY-TOO. Imagina que toman esos mismos acertijos de lingüística y les ponen un disfraz.

  • La analogía del disfraz: Es como si cambiaras las letras de una palabra. En lugar de escribir "GATO", lo escribieras como "XZQW".
    • Si el estudiante intentara usar su memoria, fallaría porque "XZQW" no existe en sus libros de texto.
    • Pero, ¡la magia está en que la lógica sigue siendo la misma! Las reglas del juego no han cambiado, solo la "piel" de las palabras.
  • El objetivo: Ahora, para resolver el problema, el estudiante no puede usar su memoria. Está obligado a mirar las pistas, encontrar patrones y deducir la respuesta desde cero, como un detective.

3. Lo que Descubrieron: La "Caída" de los Modelos

Cuando probaron a los modelos de inteligencia artificial más avanzados (como GPT-5 o Claude) con este examen disfrazado, pasó algo interesante:

  • En el examen normal (sin disfraz): Los modelos sacaban buenas notas (como un 59/100). Parecían genios.
  • En el examen con disfraz (LINGOLY-TOO): Sus notas bajaron drásticamente (a un 48/100).

¿Qué significa esto?
Significa que cuando les quitas la "muleta" de la memoria, los modelos tropiezan. Demuestra que, aunque son muy buenos recordando datos, aún no son tan buenos pensando lógicamente cuando se enfrentan a algo totalmente nuevo.

4. ¿Por qué es importante?

Imagina que quieres saber si un coche es realmente rápido. Si lo pruebas en una pista donde el coche ya conoce cada curva, va muy bien. Pero si lo pruebas en un terreno desconocido y lleno de baches, verás su verdadera capacidad de manejo.

  • LINGOLY-TOO es ese terreno desconocido.
  • Nos dice que los modelos actuales a menudo "hacen trampa" usando su memoria en lugar de razonar.
  • Ayuda a los científicos a crear mejores modelos que realmente piensen y no solo reciten.

En resumen

Los autores tomaron acertijos de olimpiadas de lingüística (donde la gente adivina reglas de idiomas desconocidos), les cambiaron las letras para que nadie pudiera "copiar" la respuesta de internet, y usaron eso para medir la inteligencia real de las IAs.

La conclusión: Las IAs son muy buenas recordando, pero cuando se les quita la memoria, su capacidad de razonamiento lógico todavía tiene mucho que mejorar. Es como si un estudiante de memoria fuera a un examen de matemáticas sin calculadora y sin poder mirar el libro de fórmulas: de repente, se da cuenta de que no sabe cómo resolver el problema, solo sabía la respuesta de memoria.