Texo: Formula Recognition within 20M Parameters

El artículo presenta Texo, un modelo minimalista de reconocimiento de fórmulas con solo 20 millones de parámetros que, gracias a un diseño eficiente y técnicas de destilación, alcanza un rendimiento comparable al de los modelos más avanzados reduciendo su tamaño hasta un 80% y permitiendo su ejecución en tiempo real en hardware de consumo.

Sicheng Mao

Publicado 2026-02-20
📖 4 min de lectura☕ Lectura para el café

Each language version is independently generated for its own context, not a direct translation.

¡Claro que sí! Imagina que este paper es la historia de cómo un grupo de investigadores creó un "superhéroe pequeño" capaz de hacer el trabajo de un "gigante" en el mundo de las matemáticas.

Aquí tienes la explicación de Texo, traducida a un lenguaje sencillo y con algunas analogías divertidas:

🌟 La Idea Principal: "Más con menos"

Imagina que tienes que leer una hoja llena de fórmulas matemáticas complejas (como las que ves en los libros de física o química) y convertirlas en código de computadora (llamado LaTeX) para que puedas editarlas.

Antes, para hacer esto bien, necesitabas máquinas enormes, pesadas y costosas (como camiones de mudanza). Los modelos más famosos, como UniMERNet o PPFormulaNet, eran como esos camiones: muy potentes, pero ocupaban mucho espacio en tu computadora y tardaban en arrancar.

Texo es la solución: es un coche deportivo pequeño y ágil.

  • El truco: Mientras que los "camiones" (modelos grandes) tienen millones de piezas internas (parámetros), Texo solo tiene 20 millones.
  • El resultado: Es tan rápido y ligero que puedes usarlo en tu computadora de casa, e incluso directamente en tu navegador web, sin necesidad de servidores costosos.

🔍 ¿Cómo lograron hacerlo tan pequeño sin perder potencia?

Los investigadores no simplemente "achicaron" el modelo; lo reconstruyeron con inteligencia. Usaron dos trucos principales:

1. El "Diccionario Inteligente" (Distilación de Vocabulario)

Imagina que estás aprendiendo a hablar.

  • Los modelos antiguos llevaban un diccionario gigante de 50,000 palabras, incluyendo palabras como "el", "y", "pero", "feliz", "triste". ¡Pero en matemáticas no necesitas esas palabras! Es como llevar un diccionario de cocina completo solo para hacer una ensalada.
  • Texo creó un diccionario a medida de solo 687 palabras. Solo incluye lo que realmente importa en las fórmulas (como "suma", "raíz cuadrada", "fracción").
  • La analogía: Es como cambiar una mochila llena de libros de historia, cocina y poesía, por una pequeña caja de herramientas que solo tiene los destornilladores y martillos necesarios para arreglar un reloj. Al quitar el peso innecesario, el modelo se vuelve muchísimo más rápido.

2. El "Traductor de Reglas" (Tokenización)

A veces, los modelos antiguos leían las fórmulas como si fueran frases largas y confusas, cortando las palabras en pedazos sin sentido.

  • Ejemplo: Si el modelo veía la flecha de una fórmula \leftarrow, lo cortaba en dos pedazos: \left y arrow. ¡Como si alguien leyera "coche" como "co" y "che" por separado!
  • Texo usa un sistema de reglas estrictas (basado en un programa llamado KaTeX) para leer las fórmulas tal como son: un solo bloque de significado completo. Esto hace que el modelo entienda mejor y cometa menos errores.

🚀 ¿Qué tan bueno es?

Aquí viene la parte mágica. Aunque Texo es 80% más pequeño que sus competidores grandes:

  • Rinde igual de bien: En pruebas, reconoce fórmulas tan bien como los gigantes.
  • Es más rápido: Es 7 veces más rápido que uno de los modelos más famosos (UniMERNet-T).
  • Funciona en cualquier lugar: Como es tan ligero, puedes usarlo en tu navegador web sin instalar nada.

🌐 La App Web: "Tu laboratorio en el navegador"

Para demostrar que su creación es realmente útil, los autores hicieron una página web (texocr.netlify.app).

  • Sin secretos: Todo el procesamiento ocurre en tu propia computadora (en el navegador), no se envían tus fotos a un servidor externo. ¡Es privado!
  • Sin instalaciones: No necesitas ser un experto en informática ni configurar servidores complejos. Subes una foto de una fórmula y ¡listo! Te da el código matemático.

📝 En resumen

Texo nos enseña que no siempre necesitas construir un "gigante" para ganar. Con un diseño inteligente, un vocabulario a medida y un poco de magia en la compresión, puedes crear una herramienta pequeña, rápida y extremadamente potente que cualquiera puede usar.

Es como demostrar que para ganar una carrera de F1 no necesitas un motor de 5000 caballos de fuerza si tienes un coche aerodinámico y un conductor experto; a veces, la eficiencia es el verdadero superpoder.

Recibe artículos como este en tu bandeja de entrada

Resúmenes diarios o semanales personalizados según tus intereses. Gists o resúmenes técnicos, en tu idioma.

Probar Digest →