Texo: Formula Recognition within 20M Parameters

O artigo apresenta o Texo, um modelo minimalista de reconhecimento de fórmulas com apenas 20 milhões de parâmetros que, graças a um design atento e técnicas de distilação, alcança desempenho comparável aos modelos mais avançados enquanto reduz drasticamente o tamanho do modelo, permitindo inferência em tempo real em hardware comum e até mesmo no navegador.

Sicheng Mao

Publicado 2026-02-20
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você tem uma pilha enorme de livros de matemática, notas de aula rabiscadas à mão e fórmulas complexas tiradas de artigos científicos. O seu objetivo é transformar todas aquelas imagens de equações em código de computador (LaTeX) que qualquer editor de texto consegue ler e editar.

Antigamente, para fazer isso, os cientistas precisavam de "monstros" de inteligência artificial. Eram modelos gigantes, pesados como um caminhão de mudança, que exigiam computadores superpotentes e caros para funcionar. Era como tentar abrir uma porta simples usando uma chave mestra do tamanho de um prédio.

Aqui entra o Texo, o protagonista deste artigo.

O Texo: O "Mini-Mestre" das Fórmulas

Os autores criaram o Texo com uma missão simples: fazer o mesmo trabalho dos gigantes, mas sendo pequeno, leve e rápido.

Enquanto os modelos anteriores (como o UniMERNet ou o PPFormulaNet) eram como caminhões cheios de peças que você nunca usaria, o Texo é como uma ferramenta multiuso de bolso. Ele tem apenas 20 milhões de parâmetros (a "memória" da inteligência artificial). Para você ter uma ideia:

  • O modelo antigo era como um caminhão de 107 ou 325 milhões de peças.
  • O Texo é um carro esportivo ágil com apenas 20 milhões.

Isso significa que você pode rodar o Texo no seu próprio computador de casa, ou até mesmo direto no navegador do seu celular, sem precisar de servidores caros na nuvem.

Como eles conseguiram isso? (A Mágica da "Poda")

A grande sacada do Texo não foi apenas diminuir o tamanho do motor, mas trocar o vocabulário.

Imagine que você está ensinando um robô a ler matemática.

  1. O jeito antigo: Eles ensinavam o robô com um dicionário de 50.000 palavras, incluindo palavras de conversas do dia a dia, gírias e termos que nunca aparecem em uma fórmula matemática. Era como ensinar um cozinheiro a fazer um bolo, mas dando a ele ingredientes para fazer também um carro, um navio e um foguete. O robô gastava muita energia e memória tentando entender tudo aquilo.
  2. O jeito do Texo: Os autores olharam para o dicionário e disseram: "Ei, matemática é muito específica!". Eles criaram um dicionário super-curado, com apenas 687 palavras essenciais para fórmulas (como "soma", "raiz quadrada", "integral").

Além disso, eles resolveram um problema de "quebra de palavras".

  • O problema: O robô antigo, ao ver a palavra \leftarrow (uma seta para a esquerda), quebrava ela em pedaços sem sentido: \left e arrow. Era como ler "caminhão" e entender "camin" + "hão", perdendo o sentido original.
  • A solução: O Texo aprendeu a ver a palavra inteira de uma vez, como um bloco único. Isso fez o robô ler muito mais rápido e com menos erros.

O Resultado na Prática

O Texo é tão eficiente que:

  • É 7 vezes mais rápido que o modelo anterior menor (UniMERNet-T).
  • Tem a mesma precisão (ou até melhor em alguns casos) que os gigantes, mesmo sendo 80% menor.
  • Funciona no seu navegador: Os autores criaram um site onde você pode tirar uma foto de uma fórmula e ver o código pronto instantaneamente, sem precisar instalar nada e sem enviar seus dados para ninguém (tudo acontece no seu computador).

A Analogia Final

Pense nos modelos antigos como bibliotecas gigantescas onde você precisa procurar um livro específico entre milhões de volumes, muitos dos quais são sobre culinária ou história, e você só quer matemática. É lento e confuso.

O Texo é como um livro de bolso de matemática pura. Ele não tem nada de supérfluo. Você abre, encontra exatamente o que precisa, e fecha. É rápido, leve e faz o trabalho perfeitamente.

Resumo da ópera: Os autores provaram que, para tarefas específicas como ler fórmulas matemáticas, você não precisa de um "supercomputador". Com um design inteligente e um vocabulário bem escolhido, um modelo pequeno e acessível pode vencer os gigantes.

Receba artigos como este na sua caixa de entrada

Digests diários ou semanais personalizados de acordo com seus interesses. Gists ou resumos técnicos, no seu idioma.

Experimentar Digest →