Making Chant Computing Easy: CantusCorpus v1.0 and the PyCantus Library

이 논문은 그레고리오 성가 연구의 계산적 접근을 용이하게 하기 위해 Cantus Index 기반의 대규모 성가 데이터를 통합한 'CantusCorpus v1.0' 데이터셋과 이를 처리하는 경량 라이브러리 'PyCantus'를 소개하며, 이를 통해 디지털 인문학 연구의 투명성과 재현성을 제고하고자 합니다.

Anna Dvořáková, Tim Eipert, Debra Lacoste, Jan Hajič

게시일 2026-03-13
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🎵 1. 배경: 흩어진 보물상자들

그레고리안 성가는 수천 년 동안 전해져 온 거대한 음악 유산입니다. 전 세계에는 이 성가를 기록한 수천 개의 고대 악보 ( manuscrips) 가 있습니다.

지금까지 이 자료들은 'Cantus (칸투스)' 라는 거대한 도서관 네트워크에 정리되어 있었습니다. 마치 전 세계에 흩어진 20 개 이상의 '별개의 도서관' 이 있고, 각각의 도서관에서 성가 한 곡씩을 찾아볼 수 있는 상태였습니다.

  • 문제점: 연구자들이 이 도서관들을 이용하려면, 도서관 하나하나에 직접 가서 (웹사이트에 접속해서) 수작업으로 책을 찾아봐야 했습니다. 컴퓨터가 자동으로 모든 도서관의 책을 한 번에 읽어와서 분석하는 것은 불가능했습니다. 마치 20 개의 다른 도서관에 있는 책을 한 번에 복사해서 책상 위에 쌓아두지 않고, 매번 도서관을 오가며 내용을 읽어야 하는 것과 같습니다.

📦 2. 해결책 1: CantusCorpus (칸투스코퍼스) - "모든 책을 한 상자에"

저자들은 이 문제를 해결하기 위해 CantusCorpus v1.0이라는 거대한 데이터셋을 만들었습니다.

  • 비유: 흩어져 있던 20 개의 도서관에 있는 모든 성가 기록 (약 88 만 개!) 을 모아서, 하나의 거대한 '디지털 상자 (데이터셋)' 에 담았습니다.
  • 이제 연구자들은 이 하나의 상자를 열면, 전 세계의 모든 성가 데이터를 한눈에 볼 수 있습니다. 더 이상 도서관을 오가며 수작업으로 찾을 필요가 없습니다.

🛠️ 3. 해결책 2: PyCantus (파이칸투스) - "상자를 쉽게 여는 열쇠"

하지만 단순히 데이터를 모으는 것만으로는 부족합니다. 일반인이나 컴퓨터 과학자가 이 데이터를 다루는 법을 몰라요. 그래서 PyCantus라는 소프트웨어 도구 (라이브러리) 를 만들었습니다.

  • 비유: 이 거대한 데이터 상자를 열어서 원하는 부분만 꺼내 쓰거나, 정렬할 때 필요한 만능 열쇠이자 도구입니다.
  • 이 도구를 사용하면, "12 세기 프랑스의 수도원에서 쓰인 성가만 찾아줘"나 "특정 가사를 가진 곡들의 멜로디 패턴을 분석해줘" 같은 복잡한 질문을 컴퓨터에게 쉽게 시킬 수 있습니다.
  • 중요한 점: 이 도구는 Cantus 시스템에만 묶여 있지 않습니다. 마치 범용 어댑터처럼, 다른 프로젝트 (예: Corpus Monodicum) 에서 만든 성가 데이터도 이 도구를 통해 쉽게 연결하고 분석할 수 있게 해줍니다.

🌍 4. 왜 이것이 중요한가요? (창의적 비유)

  1. 거인의 어깨 위에 서기:
    과거에는 소수의 성가 전문가들만 이 방대한 자료를 연구할 수 있었습니다. 하지만 이 도구들은 디지털 인문학 (Digital Humanities) 을 공부하는 학생이나 컴퓨터 과학자들도 쉽게 이 분야에 들어와 연구할 수 있게 합니다. 마치 모두가 사용할 수 있는 공용 자전거를 만들어서, 누구든 그레고리안 성가라는 거대한 산을 오를 수 있게 한 것입니다.

  2. 투명한 실험실:
    이전에는 "내가 이 데이터를 이렇게 분석했다"라고 해도, 다른 사람이 똑같은 데이터를 구하기 어려웠습니다. 하지만 이제 CantusCorpus라는 표준화된 데이터와 PyCantus라는 코드를 공유하면, 누구나 똑같은 조건으로 실험을 다시 해볼 수 있습니다. 마치 요리 레시피와 재료를 정확히 공유해서, 누구든 똑같은 맛의 요리를 만들 수 있게 하는 것과 같습니다.

  3. 새로운 발견:
    이 도구를 통해 이전에는 상상도 못 했던 거대한 규모의 분석이 가능해졌습니다. 예를 들어, "중세 시대의 정치적 사건이 성가 음악에 어떤 영향을 미쳤을까?" 같은 거대한 질문을 수만 곡의 데이터를 한 번에 분석하며 답할 수 있게 되었습니다.

💡 요약

이 논문은 "그레고리안 성가라는 거대한 보물창고를, 컴퓨터가 쉽게 다룰 수 있도록 정리하고, 누구나 그 보물을 꺼내 쓸 수 있는 열쇠 (PyCantus) 를 만들어 주었다" 는 내용입니다.

이제 성가 연구는 더 이상 소수의 전문가만의 전유물이 아니라, 데이터 과학과 결합하여 더 투명하고, 재현 가능하며, 누구나 참여할 수 있는 흥미로운 분야로 변모하고 있습니다.