Towards High-resolution and Disentangled Reference-based Sketch Colorization

이 논문은 훈련과 추론 간의 분포 차이를 직접 최소화하기 위해 이진 분기 구조와 문법 정규화 손실, 그리고 SDXL 기반의 정밀 제어 모듈을 도입하여 고해상도이고 제어 가능한 참조 기반 스케치 채색의 새로운 표준을 제시합니다.

Dingkun Yan, Xinrui Wang, Ru Wang, Zhuoru Li, Jinze Yu, Yusuke Iwasawa, Yutaka Matsuo, Jiaxian Guo

게시일 2026-03-09
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

1. 문제: "누가 누구의 옷을 입었지?" (공간적 엉킴)

기존의 채색 기술은 마치 연극 배우가 대본 (스케치) 을 읽다가, 옆에 있는 다른 배우의 의상 (참고 이미지) 을 잘못 가져와 입는 상황과 비슷했습니다.

  • 상황: 화가가 "여기 하늘을 파랗게 칠해"라고 스케치에 표시했는데, AI 는 옆에 있는 참고 이미지에서 "아! 저기 파란색이 있네!"라고 생각해서, 하늘이 아닌 캐릭터의 머리카락까지 파랗게 칠해버리거나, 스케치에 없는 물체가 갑자기 튀어나오는 어색한 결과가 나옵니다.
  • 원인: AI 가 훈련할 때는 "스케치와 참고 이미지가 딱 맞는 짝꿍"으로만 배웠는데, 실제 사용할 때는 "서로 전혀 다른 스케치와 참고 이미지"를 섞어주니까 AI 가 혼란을 겪은 것입니다. 이를 논문에서는 **'공간적 엉킴 (Spatial Entanglement)'**이라고 부릅니다.

2. 해결책 1: "쌍둥이 훈련법" (이중 분기 구조)

이 문제를 해결하기 위해 연구진은 AI 에게 '쌍둥이'처럼 두 가지 상황을 동시에 훈련시키는 방법을 고안했습니다.

  • 형 (올바른 훈련): 스케치와 참고 이미지가 딱 맞는 짝꿍일 때, "참고 이미지의 색만 가져와라! 모양은 스케치대로 해라!"라고 가르칩니다.
  • 동생 (혼란 훈련): 스케치와 참고 이미지가 전혀 다른 짝꿍 (예: 고양이 스케치에 강아지 참고 이미지) 일 때, "아무리 참고 이미지가 강아지라도, 스케치가 고양이니까 고양이 모양을 지켜야 해!"라고 훈련시킵니다.
  • 효과: 이 두 가지 상황을 비교하면서 AI 는 **"색감은 참고 이미지에서 가져오되, 모양과 구조는 오직 스케치에만 의존해야 한다"**는 규칙을 완벽하게 깨우치게 됩니다. 마치 색칠공부를 할 때, "색만 따라 하고 선은 네가 그린 대로 지켜라"라고 엄격하게 훈련시키는 것과 같습니다.

3. 해결책 2: "세부 묘사 전문가" (WD-Tagger 와 플러그인)

단순히 모양과 색만 맞추는 게 아니라, 고화질 (HD) 로 그릴 때 질감까지 살아나게 하는 기술도 추가했습니다.

  • WD-Tagger (세부 묘사 전문가): 기존 AI 는 "파란색"이라고만 대충 이해했지만, 이 새로운 기술은 "눈동자 색, 머리카락 빛, 옷감의 주름"까지 **애니메이션 특유의 미세한 특징 (태그)**을 정확히 인식합니다. 마치 전문 미용사가 머리카락 하나하나의 결까지 신경 쓰며 스타일링을 해주는 것과 같습니다.
  • 플러그인 모듈 (배경 전문가): 캐릭터는 잘 그리는데 배경이 흐릿하거나 엉망이 되는 경우가 많죠. 이 모듈은 **배경과 전체적인 분위기 (스타일)**를 참고 이미지에서 자연스럽게 끌어와 채워줍니다.

🌟 요약: 이 기술이 왜 대단한가요?

  1. 고화질 (High-Resolution): 기존 기술은 그림을 크게 하면 흐릿해지거나 깨졌는데, 이 기술은 1024px~1280px 이상의 고해상도에서도 선명하고 질감이 살아있는 그림을 만들어냅니다.
  2. 정확한 제어 (Disentangled): "이 부분만 이 색으로, 저 부분은 저 색으로"라고 요구하면 AI 가 정확하게 구분해서 채색해 줍니다. (예: 하늘은 파랗게, 캐릭터 머리는 갈색으로)
  3. 실제 활용도: 애니메이션 제작이나 디지털 일러스트 작업에서, 화가가 스케치만 그리면 AI 가 전문가 수준의 채색 작업을 대신해 줄 수 있어 시간을 획기적으로 단축해 줍니다.

한 줄 요약:

"이 기술은 AI 에게 '색깔은 참고해서 가져오되, 모양은 내가 그린 스케치대로만 지켜라'는 철칙을 가르쳐서, 흐트러짐 없이 선명하고 아름다운 고화질 채색 그림을 만들어내는 혁신적인 방법입니다."