VietNormalizer: An Open-Source, Dependency-Free Python Library for Vietnamese Text Normalization in TTS and NLP Applications

Este artigo apresenta o VietNormalizer, uma biblioteca Python de código aberto e sem dependências externas que oferece uma solução unificada baseada em regras para a normalização de texto vietnamita, convertendo números, datas, moedas, porcentagens, siglas e termos estrangeiros em suas formas faladas para aplicações de TTS e NLP.

Hung Vu Nguyen, Loan Do, Thanh Ngoc Nguyen, Ushik Shrestha Khwakhali, Thanh Pham, Vinh Do, Charlotte Nguyen, Hien Nguyen

Publicado 2026-03-05
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você tem um robô muito inteligente que sabe falar, mas ele é um pouco "teimoso" e só entende palavras escritas exatamente como soam. Se você pedir para ele ler um bilhete que diz "A reunião é às 14:30 com 1.500.000 reais", o robô vai tentar ler os números e símbolos literalmente, como se fossem nomes estranhos, e vai soar completamente sem sentido.

O VietNormalizer é como um tradutor mágico e super-rápido que conserta esse bilhete antes de entregar ao robô. Ele transforma "14:30" em "quatorze horas e trinta minutos" e "1.500.000" em "um milhão e quinhentos mil", tudo em vietnamita, pronto para ser falado.

Aqui está a explicação do artigo, usando analogias do dia a dia:

1. O Problema: A "Sopa de Letras" do Mundo Real

No dia a dia, as pessoas escrevem de tudo misturado: números, datas, siglas de empresas (como NASA), moedas e palavras em inglês. Para um computador que vai transformar texto em voz (TTS), isso é um pesadelo. É como tentar cozinhar um prato gourmet usando ingredientes que ainda estão na embalagem fechada. O computador precisa que tudo esteja "aberto" e pronto para o consumo.

Antes desse projeto, as ferramentas para o vietnamita eram ou:

  • Muito pesadas: Como tentar usar um caminhão de bombeiros para apagar uma vela. Elas exigiam computadores gigantes e internet para funcionar.
  • Muito limitadas: Como uma chave de fenda que só serve para um tipo específico de parafuso. Elas não entendiam dinheiro, datas ou palavras estrangeiras.

2. A Solução: O "Canivete Suíço" Leve

O VietNormalizer é apresentado como uma ferramenta leve, gratuita e que não precisa de nada além do Python (a linguagem de programação). Pense nele como um canivete suíço que cabe no bolso de qualquer desenvolvedor.

Ele faz sete coisas principais, como se fosse uma linha de montagem de uma fábrica de voz:

  1. Números: Transforma "123" em "cento e vinte e três".
  2. Datas e Horas: Muda "25/12" para "vinte e cinco de dezembro".
  3. Dinheiro: Converte "1.000.000 VND" para "um milhão de dong".
  4. Porcentagens: Muda "50%" para "cinquenta por cento".
  5. Siglas: Transforma "NASA" em "na-sa" (como se fosse falado).
  6. Palavras Estrangeiras: Adapta palavras em inglês para o som vietnamita (ex: "container" vira "cong-te-no").
  7. Limpeza: Remove emojis e caracteres estranhos que confundem o robô.

3. O Segredo: Regras, não "Adivinhação"

Muitas ferramentas modernas usam Inteligência Artificial (redes neurais) para tentar "adivinhar" o que o texto significa. Isso é como ter um aluno que precisa estudar milhares de livros para aprender a ler um bilhete. É pesado e lento.

O VietNormalizer usa regras fixas (como uma receita de bolo). Se o texto tem um ponto e dois números, é uma hora. Se tem um "VND", é dinheiro.

  • Vantagem: É instantâneo. Não precisa de internet, não precisa de placas de vídeo caras e funciona até em celulares antigos.
  • Analogia: É a diferença entre pedir para um chef de cozinha famoso (IA) cozinhar um ovo (demorado e caro) e você mesmo usar um ovo frito pronto (regra simples e rápida).

4. Por que isso é importante?

O artigo explica que, para países com menos recursos de tecnologia (como o Vietnã), não há dados suficientes para treinar essas IAs gigantes. Então, a melhor solução é usar a lógica humana (regras) codificada em software.

O VietNormalizer é como uma ponte que permite que qualquer pessoa, sem gastar dinheiro com servidores caros, crie assistentes de voz, sistemas de leitura de notícias ou aplicativos que falem vietnamita de forma natural.

Resumo Final

O VietNormalizer é uma ferramenta de limpeza e organização de texto feita para o vietnamita. Ele pega textos bagunçados cheios de números e símbolos, aplica regras simples e rápidas para transformá-los em frases que soam naturais quando faladas, e faz tudo isso sem precisar de equipamentos pesados ou conexão com a nuvem. É uma solução prática, gratuita e aberta para todos usarem.