SKeDA: A Generative Watermarking Framework for Text-to-video Diffusion Models

본 논문은 텍스트-비디오 생성 모델의 콘텐츠 무결성과 저작권 보호를 위해 프레임 재배열 및 시간적 왜곡에 강인한 'SKeDA'라는 생성형 워터마킹 프레임워크를 제안합니다.

Yang Yang, Xinze Zou, Zehua Ma, Han Fang, Weiming Zhang

게시일 2026-03-03
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

1. 왜 이 기술이 필요한가요? (문제 상황)

요즘 AI 가 "고양이가 우주선을 타고 간다"는 말만 하면, 진짜처럼 보이는 동영상을 만들어냅니다. 하지만 문제는 누가 만들었는지, 저작권은 누구에게 있는지를 알기 어렵다는 점입니다.

  • 기존 방법의 문제점: 예전에는 동영상이 다 만들어진 뒤에, 마치 요리된 음식에 소금이나 향신료를 뿌리는 것처럼 watermark(워터마크) 를 넣었습니다.
    • 단점 1: 음식 맛이 변할 수 있습니다 (화질 저하).
    • 단점 2: 음식을 자르거나 (프레임 삭제), 재가공하면 (압축) 소금이 다 날아가서 흔적이 사라집니다.

2. SKeDA 의 핵심 아이디어: "요리할 때부터 섞기"

이 논문은 "음식을 다 만든 뒤에 소금을 뿌리는 게 아니라, 요리 시작할 때부터 반죽 속에 소금을 섞어라"라고 제안합니다.

AI 가 동영상을 그리는 과정 (확산 모델) 에서, 아직 그림이 나오기 전인 '잡음 (노이즈)' 단계에 워터마크 정보를 섞어 넣습니다. 이렇게 하면 워터마크는 동영상의 DNA 와 하나가 되어, 동영상이 완성될 때 자연스럽게 함께 태어나게 됩니다.

3. SKeDA 의 두 가지 마법 도구

이 기술은 두 가지 특별한 장비를 사용합니다.

① SKe (셔플-키): "카드 섞기 장난감"

  • 상황: 동영상이 100 프레임 (장면) 으로 이루어져 있다고 칩시다. 기존 방식은 1 번째 장면에 1 번 정보, 2 번째 장면에 2 번 정보를 넣었습니다. 만약 1 번째 장면을 삭제하거나 순서를 바꾸면 (카드를 섞으면), 정보가 깨져서 읽을 수 없게 됩니다.
  • SKe 의 해결책: SKe 는 하나의 기본 카드 덱을 만들어서, 각 프레임마다 그 카드를 무작위로 섞어서 (Shuffle) 사용합니다.
    • 비유: 100 개의 방에 각각 다른 열쇠를 넣는 게 아니라, 하나의 열쇠를 100 번씩 섞어서 모든 방에 넣는 것과 같습니다.
    • 효과: 만약 100 개 중 50 개 방이 사라지거나 순서가 뒤바뀌어도, 남은 방들만 모아도 원래 열쇠 (워터마크) 를 다시 맞출 수 있습니다. 동영상의 일부가 잘려도 워터마크가 살아남는 것입니다.

② DA (차이점 주의): "현명한 감시 카메라"

  • 상황: 동영상을 압축하거나 노이즈가 생기면, 어떤 장면은 흐릿해지고 어떤 장면은 선명해집니다. 모든 장면을 똑같이 믿고 워터마크를 읽으려다 보면, 흐릿한 장면 때문에 전체가 망가질 수 있습니다.
  • DA 의 해결책: DA 는 각 장면이 얼마나 안정적인지를 실시간으로 체크합니다.
    • 비유: 감시 카메라가 "이 장면은 흔들려서 믿을 수 없으니 무시하고, 저 장면은 선명하니까 집중해서 봐!"라고 중요도에 따라 점수를 다르게 매기는 것입니다.
    • 효과: 동영상이 압축되거나 손상되어도, 가장 잘 보존된 장면들만 모아 워터마크를 정확히 찾아냅니다.

4. 이 기술의 성과 (결과)

실험 결과, SKeDA 는 다음과 같은 놀라운 성과를 냈습니다.

  1. 화질은 그대로: 워터마크를 넣어도 동영상이 뭉개지거나 흐려지지 않습니다. (요리 맛은 그대로 유지)
  2. 압축에도 강함: 동영상을 유튜브처럼 많이 압축하거나, 일부 장면을 잘라내도 워터마크가 사라지지 않습니다. (비유하자면, 요리를 잘게 썰어도 반죽 속에 섞인 소금 맛은 여전히 느껴집니다.)
  3. 정확도: 기존 기술들보다 워터마크를 찾아내는 정확도가 훨씬 높습니다.

5. 요약

SKeDA는 AI 가 만드는 동영상을 보호하기 위해, 동영상이 만들어지는 순간부터 워터마크를 DNA 수준으로 섞어 넣는 기술입니다.

  • 기존: 요리 끝난 뒤에 소금 뿌리기 → 맛 변함, 잘리면 소금 날아감.
  • SKeDA: 요리 시작할 때 반죽에 소금 섞기 → 맛 변함 없음, 잘려도 소금 맛 남음.

이 기술 덕분에 앞으로 AI 가 만든 동영상이 저작권 침해를 하거나 가짜 뉴스가 되어도, **"이건 누구의 작품이고, 어디서 왔는지"**를 쉽게 증명할 수 있게 될 것입니다.