A Triadic Suffix Tokenization Scheme for Numerical Reasoning

Este artículo presenta la Tokenización de Sufijos Triádicos (TST), un esquema determinista que divide los números en grupos de tres dígitos con marcadores de magnitud explícitos para resolver las inconsistencias de las tokenizaciones subpalabra estándar y mejorar el razonamiento numérico en modelos de lenguaje grandes.

Autores originales: Olga Chetverina

Publicado 2026-04-14
📖 4 min de lectura☕ Lectura para el café

Esta es una explicación generada por IA del artículo a continuación. No ha sido escrita ni avalada por los autores. Para mayor precisión técnica, consulte el artículo original. Leer descargo de responsabilidad completo

Each language version is independently generated for its own context, not a direct translation.

Imagina que las Inteligencias Artificiales (como los modelos de lenguaje que usas hoy) son como niños genios que han leído millones de libros, pero que tienen una dificultad extraña: no entienden bien los números.

Si le preguntas a un niño genio si "9.11" es más grande que "9.9", a veces te dirá que sí, porque ve dos dígitos después del punto y piensa que es más grande, sin entender que el "11" en realidad es solo once centésimas, mientras que el "9" es noventa centésimas.

¿Por qué pasa esto? Porque cuando la computadora "lee" un número, lo rompe en pedazos pequeños y desordenados, como si intentara armar un rompecabezas sin ver la imagen de la caja.

Este paper propone una solución brillante llamada Tokenización de Sufijos Triádicos (TST). Vamos a explicarlo con una analogía sencilla.

🌟 La Analogía: El Sistema de Cajas y Etiquetas

Imagina que tienes que transportar cajas de manzanas.

  1. El problema actual (Tokenización normal):
    Imagina que tienes 1.234.567 manzanas. El sistema actual las tira todas en una pila gigante y las etiqueta con códigos extraños como "1", "2", "3", "4"... La computadora tiene que adivinar cuántas manzanas hay en total basándose solo en el orden en que aparecen las cajas. Es como intentar adivinar el peso de una montaña solo mirando piedras sueltas.

  2. La solución propuesta (TST):
    El autor propone un sistema de cajas de tres en tres (grupos de mil) con etiquetas mágicas pegadas en cada caja.

    En lugar de escribir 1234567, el sistema lo reescribe así:

    1 millón - 234 mil - 567

    Aquí está la magia:

    • Grupos de tres: Agrupa los números de tres en tres (como hacemos en español: miles, millones, billones).
    • Etiquetas de tamaño (Sufijos): Pega una etiqueta en cada grupo que diga exactamente qué tan grande es.
      • k = mil (thousand)
      • m = millón (million)
      • b = billón (billion)
    • Para los decimales: Si tienes números después del punto (como 0.123456), usa una etiqueta especial p (para "parte") que se repite para indicar qué tan pequeño es el trozo.
      • 123p = 123 milésimas.
      • 456pp = 456 millonésimas.

¿Por qué es genial esto?

1. Elimina las adivinanzas

Antes, la IA tenía que adivinar: "¿Este '123' son 123 manzanas, o 123 mil manzanas?".
Con TST, la etiqueta lo dice claramente: "123k" significa exactamente 123 mil. No hay duda. Es como poner una etiqueta de precio en cada caja en lugar de tener que contar todo el almacén cada vez.

2. Es como leer en voz alta

Cuando nosotros leemos un número, decimos: "Un millón doscientos treinta y cuatro mil...".
El sistema TST hace que la computadora "lea" el número de la misma manera, grupo por grupo, con su tamaño explícito. Le da a la IA el mismo "sentido común" que tenemos los humanos.

3. Precisión perfecta

A veces, escribir 0.1 o 0.100 parece diferente, pero es lo mismo. El sistema TST estandariza esto. Asegura que 0.1 siempre se vea igual internamente, evitando que la computadora se confunda por pequeños detalles de escritura.

Las dos formas de usarlo

El paper sugiere dos formas de implementar esto, como elegir entre dos tipos de herramientas:

  • Opción A (Etiquetas separadas): Escribes el número y luego pegas la etiqueta. Ejemplo: 123 + k. Es como tener cajas sueltas y pegatinas sueltas. Es fácil de añadir, pero la computadora tiene que unirlos mentalmente.
  • Opción B (Cajas pre-etiquetadas): Creas cajas nuevas que ya vienen con la etiqueta pegada. Ejemplo: Una caja que dice 123k como un solo objeto. Es más rápido para la computadora procesar, pero necesitas más espacio en el "inventario" de palabras (vocabulario) de la IA.

En resumen

Este paper dice: "Dejemos de romper los números en pedazos confusos. Agrupémoslos en tríos y peguemos una etiqueta gigante que diga su tamaño real."

Es como pasar de darle a un niño un montón de letras sueltas para que adivine una palabra, a darle la palabra completa escrita en mayúsculas con un signo de exclamación gigante.

¿El resultado? Se espera que las IAs cometan muchos menos errores en matemáticas, ciencia y razonamiento numérico, porque ya no tendrán que adivinar el tamaño de los números, sino que lo verán escrito claramente en cada paso. ¡Y lo mejor es que esto se puede añadir a cualquier IA existente sin tener que cambiar su cerebro, solo cambiando cómo leen los números!

¿Ahogado en artículos de tu campo?

Recibe resúmenes diarios de los artículos más novedosos que coincidan con tus palabras clave de investigación — con resúmenes técnicos, en tu idioma.

Probar Digest →