SongSong: A Time Phonograph for Chinese SongCi Music from Thousand of Years Away

이 논문은 고대 중국 송사 (SongCi) 음악의 리듬과 스타일을 복원하기 위해 고안된 최초의 음악 생성 모델 '송송 (SongSong)'과 대규모 데이터셋 'OpenSongSong'을 소개하며, 기존 모델들보다 우수한 성능을 입증합니다.

Jiajia Li, Jiliang Hu, Ziyi Pan, Chong Chen, Zuchao Li, Ping Wang, Lefei Zhang

게시일 2026-03-02
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

송송 (SongSong): 천 년 전의 노래를 되살리는 '음악 시계'

이 논문은 고대 중국의 시인들, 특히 '송 (宋)'나라 시대의 시 (송시, SongCi) 를 현대의 인공지능이 어떻게 부르고 연주할 수 있게 했는지 소개합니다. 마치 시간을 거슬러 올라가는 '음악 시계'나 '레코드 플레이어' 같은 역할을 하는 기술입니다.

이 내용을 일반인도 쉽게 이해할 수 있도록 비유와 함께 설명해 드릴게요.


1. 왜 이 연구가 필요할까요? (잃어버린 악보의 문제)

상상해 보세요. 수천 년 전의 아름다운 시가 있지만, 그 시를 부르는 선율 (멜로디) 악보는 모두 사라져 버렸다고 가정해 봅시다.

  • 현재 상황: 요즘 인공지능 (Suno, SkyMusic 등) 은 팝송을 아주 잘 만듭니다. 하지만 고전적인 중국 송시를 부르게 하면, 마치 고급 한복을 입고 힙합 춤을 추는 것처럼 어색합니다. 팝송 스타일 (기타, 드럼) 로 부르기 때문에 고유의 운율과 분위기를 전혀 살리지 못합니다.
  • 문제점: 고대 음악을 학습할 데이터가 없어서 AI 가 배울 수 없었습니다.

2. 송송 (SongSong) 이란 무엇인가요?

저자들은 **'송송 (SongSong)'**이라는 새로운 AI 모델을 만들었습니다. 이 모델은 단순히 시를 듣고 노래를 부르는 게 아니라, 3 단계에 걸친 정교한 요리 과정을 거칩니다.

🍳 1 단계: 시를 '리듬'으로 번역하기 (요리 레시피 만들기)

  • 비유: 시의 글자 하나하나가 어떤 박자 (리듬) 를 타고 가야 할지 결정하는 단계입니다.
  • 작동: AI 가 시를 읽고, 각 글자가 어떤 박자에 맞춰져야 하는지 '리듬 패턴'을 먼저 예측합니다.

🎼 2 단계: 리듬을 '멜로디'로 변환하기 (요리 재료 준비)

  • 비유: 결정된 리듬에 맞춰 어떤 음 (음정) 을 쓸지 악보 (MIDI) 를 그리는 단계입니다.
  • 작동: 리듬 정보를 바탕으로 "이 글자는 도 (Do) 음, 저 글자는 레 (Re) 음"처럼 구체적인 악보를 생성합니다.

🎤 3 단계: 노래와 반주를 합치기 (완성된 요리)

  • 비유: 만든 악보를 바탕으로 **가수 (목소리)**가 노래하고, **반주 악기 (고쟁 등)**가 연주하는 소리를 따로 만들어서 합칩니다.
  • 특징: 단순히 소리를 합치는 게 아니라, 고전 악기인 '고쟁 (Gu Zheng)' 소리가 나도록 반주를 특별히 설계합니다.

3. '오픈송송 (OpenSongSong)'이라는 보물상자

AI 가 배울 수 있도록, 연구팀은 29.9 시간 분량의 고대 송시 음악 데이터를 직접 모아서 '오픈송송'이라는 공개 데이터를 만들었습니다.

  • 의미: 마치 고대 음악가들의 비밀 악보와 녹음 테이프를 발굴해서 AI 에게 가르친 것과 같습니다. 이 데이터 덕분에 AI 는 고전적인 분위기를 정확히 이해할 수 있게 되었습니다.

4. 다른 AI 와 비교하면 어떨까요?

연구팀은 송송을 최신 상업용 AI (Suno, SkyMusic) 와 비교 실험을 했습니다.

  • Suno/SkyMusic:
    • 결과: 시를 부르기는 하지만, 팝송 스타일로 부릅니다. 고쟁 대신 기타 소리가 나거나, 시의 운율을 무시하고 리듬을 바꾸는 경우가 많았습니다.
    • 비유: 한복을 입고 클럽에서 춤을 추는 것 같습니다.
  • 송송 (SongSong):
    • 결과: 시의 원래 운율과 고전적인 분위기를 완벽하게 살렸습니다. 가사 하나하나를 정확하게 발음하고, 고쟁 반주가 어우러져 진짜 고전 음악처럼 들립니다.
    • 비유: 전통 공연장에서 고수들이 연주하는 것처럼 정갈하고 아름답습니다.

5. 결론: 왜 이것이 중요한가요?

이 연구는 단순히 노래를 만드는 기술을 넘어, 문화 유산을 디지털로 되살리는 (Restoration) 첫걸음입니다.

  • 핵심 메시지: "고대 시를 AI 가 부르게 하려면, 팝송을 배우게 해서는 안 되고, 고전 음악의 규칙 (리듬과 멜로디) 을 따로 가르쳐야 한다"는 것을 증명했습니다.

한 줄 요약:

송송은 잃어버린 천 년 전의 노래를 찾아내어, AI 가 고전 악기와 함께 그 시대의 분위기를 그대로 재현하게 해주는 **'시간 여행 음악 시계'**입니다.