TokenTrace: Multi-Concept Attribution through Watermarked Token Recovery

이 논문은 생성형 AI 모델이 생성한 이미지에서 여러 개념 (객체 및 스타일 등) 을 개별적으로 식별하고 출처를 추적할 수 있도록, 텍스트 프롬프트 임베딩과 초기 잠재 노이즈를 동시에 교란하여 시맨틱 도메인에 비밀 서명을 삽입하는 새로운 프로액티브 워터마킹 프레임워크인 'TokenTrace'를 제안합니다.

Li Zhang, Shruti Agarwal, John Collomosse, Pengtao Xie, Vishal Asnani

게시일 2026-02-24
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

TokenTrace: 그림 속의 '보이지 않는 서명'을 찾아내는 마법

이 논문은 인공지능 (AI) 이 그린 그림이 누구의 아이디어나 스타일을 사용했는지를 증명하는 새로운 기술을 소개합니다. 기존 방법들의 한계를 뛰어넘어, 한 장의 그림에 여러 가지 개념 (예: '고양이'와 '반 고흐 스타일') 이 섞여 있더라도 각각을 정확히 찾아내는 방법을 제안합니다.

이 복잡한 기술을 일상적인 비유로 쉽게 설명해 드릴게요.


1. 문제 상황: "누가 이 그림을 그렸을까?"

AI 가 그림을 그릴 때, 화가의 독특한 스타일이나 특정 사물을 배워 그립니다. 하지만 AI 가 그린 그림에는 어떤 화가의 스타일이 쓰였는지, 어떤 물체가 포함되었는지를 알 수 있는 '신원증명'이 없습니다.

  • 기존의 방법 (수동적 도장): 그림이 완성된 뒤에 나중에 도장을 찍는 방식입니다. 하지만 그림을 자르거나, 압축하거나, 필터를 씌우면 도장이 지워지거나 변형되어 사라지기 쉽습니다.
  • 기존의 방법 (단일 서명): 그림 전체에 하나의 '보이지 않는 서명'을 넣는 방식입니다. 하지만 그림에 '고양이'와 '반 고흐 스타일'이 섞여 있을 때, 이 서명은 두 개념을 구분하지 못합니다. 마치 "이 집은 누구의 집인가?"라고 물었을 때, "이 집은 '집'입니다"라고만 대답하는 것과 같습니다.

2. TokenTrace 의 해결책: "개념별 비밀 키"

저자들은 **"각 개념 (고양이, 스타일 등) 마다 별도의 비밀 키를 숨기자"**라고 생각했습니다. 그리고 그 키를 그림이 만들어지는 가장 초기 단계부터 숨깁니다.

🎨 비유: 요리를 할 때의 비밀 레시피

AI 가 그림을 그리는 과정을 요리라고 상상해 보세요.

  • 기존 방법: 요리가 다 된 접시 (완성된 그림) 에 나중에 소금 (워터마크) 을 뿌리는 것입니다. 하지만 접시를 흔들면 소금이 다 떨어집니다.
  • TokenTrace 방법:
    1. 재료 준비 단계 (텍스트): "고양이"라는 단어와 "반 고흐 스타일"이라는 단어를 섞기 전에, 각 단어에 **보이지 않는 마법 가루 (비밀 키)**를 살짝 뿌립니다.
    2. 반죽 단계 (잠재 공간): 반죽을 섞을 때 (초기 노이즈), 각 재료에 맞는 특수한 향신료를 섞어 넣습니다.
    3. 완성: 이렇게 만들어진 요리는 겉보기에는 일반 요리와 똑같지만, 안에는 각 재료마다 고유한 '비밀 신호'가 깊이 배어 있습니다.

이 방식의 핵심은 서명을 그림의 '표면'이 아니라, 그림이 만들어지는 '의미 (텍스트)'와 '구조 (반죽)' 속에 함께 녹여낸다는 점입니다. 그래서 그림을 자르거나 변형해도 그 신호는 사라지지 않습니다.

3. 어떻게 찾아낼까? "질문하는 탐정"

그림에서 비밀을 찾아내는 과정은 **질문 (Query)**을 통해 이루어집니다.

  • 기존 방법: 그림을 보고 "이게 누구 스타일이야?"라고 막연하게 추측합니다.
  • TokenTrace 방법:
    • 탐정 (시스템) 이 그림을 들고 **"여기 '고양이'의 비밀 키가 있니?"**라고 묻습니다.
    • 시스템은 그림을 분석하며 "네, 여기 '고양이'의 비밀 키가 있어요!"라고 답하고, 그 키를 꺼냅니다.
    • 그다음 **"그럼 '반 고흐 스타일'의 키는?"**라고 다시 묻습니다.
    • 시스템은 다시 "네, 여기 있어요!"라고 답하며 두 번째 키를 꺼냅니다.

이처럼 "무엇을 찾을지 질문을 던지는 방식" 덕분에, 한 장의 그림에 여러 가지 개념이 섞여 있어도 서로 섞이지 않고 각각을 정확히 찾아낼 수 있습니다.

4. 왜 이 기술이 특별한가?

  1. 구분 능력 (Disentanglement): 한 장의 그림에 '고양이'와 '스타일'이 섞여 있어도, 각자의 서명을 따로 찾아냅니다. 마치 한 병에 섞인 콩과 쌀을 각각 따로 꺼내는 것과 같습니다.
  2. 튼튼함 (Robustness): 그림을 자르거나, 압축하거나, 필터를 씌워도 서명이 살아남습니다. 왜냐하면 서명이 그림의 '뼈대'와 '영혼'에 박혀 있기 때문입니다.
  3. 화질 유지: 그림에 서명을 넣었다고 해서 화질이 나빠지거나 뭉개지지 않습니다. 눈으로 보기엔 원본과 똑같습니다.

5. 요약: TokenTrace 의 핵심 메시지

"그림이 만들어질 때, 각 요소 (개념) 마다 고유한 비밀 서명을 숨겨두세요. 그리고 나중에 '무엇을 찾을지' 질문만 하면, 그 서명을 정확히 찾아내어 저작권을 증명하세요."

이 기술은 AI 가 만든 예술 작품의 저작권을 보호하고, 창작자의 노고를 인정받을 수 있는 강력한 도구가 될 것입니다. 마치 AI 그림이 자신의 '출생증명서'를 가지고 다니는 것과 같습니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →