VietNormalizer: An Open-Source, Dependency-Free Python Library for Vietnamese Text Normalization in TTS and NLP Applications

이 논문은 TTS 및 NLP 응용을 위해 숫자, 날짜, 통화, 약어 및 외래어 등을 발음 가능한 베트남어 형태로 변환하는 경량 규칙 기반 오픈소스 라이브러리 'VietNormalizer'를 제안합니다.

Hung Vu Nguyen, Loan Do, Thanh Ngoc Nguyen, Ushik Shrestha Khwakhali, Thanh Pham, Vinh Do, Charlotte Nguyen, Hien Nguyen

게시일 2026-03-05
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **'VietNormalizer(비엣노말라이저)'**라는 새로운 도구를 소개합니다. 이 도구를 쉽게 이해하려면 **'음성 합성 (TTS) 을 위한 요리사'**의 비유를 들어볼 수 있습니다.

🍳 비유: 컴퓨터가 읽는 '요리 재료' 정리하기

컴퓨터가 사람 목소리로 글을 읽어주는 (TTS) 작업을 상상해 보세요. 컴퓨터는 "14:30", "1,500,000 원", "NASA" 같은 숫자나 약어를 그대로 읽으면 엉뚱한 소리를 냅니다. 마치 요리사가 "14:30"이라는 숫자 덩어리를 그대로 입에 넣으려 하거나, "NASA"라는 알파벳을 그대로 씹으려 하는 것과 비슷하죠.

VietNormalizer는 바로 이 **'재료를 손질하는 주방장'**입니다.

  • "14:30"을 들어오면 → "오후 두 시 삼십 분"으로 다듬어 줍니다.
  • "1,500,000 원"을 보면 → "백오십만 원"으로 바꿔줍니다.
  • "NASA"를 보면 → "나사"라고 발음하기 쉬운 한국어 소리로 바꿔줍니다.

이렇게 손질된 재료 (텍스트) 만이 컴퓨터가 자연스러운 목소리로 요리 (발음) 를 할 수 있게 해줍니다.


🚀 이 도구가 특별한 이유 3 가지

기존에 있던 도구들은 몇 가지 큰 단점이 있었습니다. VietNormalizer 는 이 모든 문제를 해결했습니다.

1. 무거운 짐을 다 내려놓았습니다 (Zero-Dependency)

  • 기존 도구들: 무거운 AI(인공지능) 모델을 실행하려면 컴퓨터에 거대한 짐 (수 GB 의 데이터, GPU 등) 을 싣고 다녀야 했습니다. 마치 간단한 김밥을 말려고 대형 트럭을 불러야 하는 꼴이었죠.
  • VietNormalizer: 오직 **규칙 (Rule)**만 사용합니다. AI 모델이 필요 없어 아주 가볍고 빠릅니다. 스마트폰이나 작은 서버에서도 즉시 실행할 수 있습니다. "가방 하나만 들고 여행하는 가벼운 여행객"과 같습니다.

2. 모든 재료를 한 번에 다 다룹니다 (Comprehensive Coverage)

  • 기존 도구들: 숫자만 다듬거나, 날짜만 다듬는 등 부분적으로만 일했습니다.
  • VietNormalizer: 숫자, 날짜, 시간, 돈, 퍼센트, 약어, 외국어까지 일곱 가지 카테고리를 모두 다룹니다. 마치 모든 재료를 한 번에 손질해주는 만능 칼과 도마처럼 작동합니다.

3. 누구나 쉽게 수정할 수 있습니다 (User-Extensible)

  • 기존 도구들: 새로운 약어가 생기면 코드를 고쳐야 해서 일반인이 쓰기 어려웠습니다.
  • VietNormalizer: 엑셀 파일 (CSV) 처럼 간단한 목록만 만들어서 추가하면 됩니다. 마치 레시피 책에 새로운 재료를 적어 넣는 것처럼 누구나 쉽게 커스터마이징할 수 있습니다.

🌍 이 도구가 중요한 이유

이 논문은 베트남어뿐만 아니라 **전 세계의 '저자원 언어 (데이터가 부족한 언어)'**들에게도 큰 의미가 있습니다.

  • 현재 상황: 대부분의 언어에는 AI 를 훈련시킬 만큼의 데이터가 없습니다. AI 가 요리를 하려면 많은 식재료가 필요한데, 데이터가 부족하면 AI 는 요리를 못 합니다.
  • 해결책: VietNormalizer 는 규칙 기반이므로 데이터가 없어도 언어 전문가가 몇 일만 공부하면 만들 수 있습니다. 이는 데이터가 부족한 태국, 라오스, 캄보디아 같은 언어들에게도 똑같은 방식으로 적용할 수 있는 **'블루프린트 (설계도)'**가 됩니다.

💡 요약하자면

VietNormalizer는 복잡한 AI 없이, 가볍고 빠르며 정확한 규칙만으로 베트남어 텍스트를 컴퓨터가 읽기 좋은 말로 바꿔주는 만능 도구입니다.

  • 누구에게 필요한가요? 컴퓨터로 목소리를 내는 서비스 (TTS) 를 만들거나, 베트남어 텍스트를 분석하려는 개발자.
  • 어떻게 쓰나요? 파이썬 (Python) 으로 쉽게 설치 (pip install vietnormalizer) 하고, 텍스트만 넣으면 바로 다듬어진 결과를 얻습니다.

이 도구는 **"데이터가 부족해도 규칙만 있다면, 누구든 고품질의 음성 서비스를 만들 수 있다"**는 희망을 보여주는 사례입니다.