You Don't Need All That Attention: Surgical Memorization Mitigation in Text-to-Image Diffusion Models

이 논문은 텍스트-이미지 확산 모델의 훈련 데이터 암기 현상을 해결하기 위해, 프롬프트별 주의를 정교하게 조절하여 원본 훈련 이미지를 재현하지 않으면서도 프롬프트와 일치하는 고품질 이미지를 생성하는 새로운 프레임워크인 'GUARD'를 제안합니다.

Kairan Zhao, Eleni Triantafillou, Peter Triantafillou

게시일 2026-03-03
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🎨 제목: "너무 많은 주목은 필요 없어: AI 화가의 '기억'을 수술하는 방법"

1. 문제 상황: AI 의 '불안한 기억력'

생각해 보세요. 어떤 AI 화가가 수만 장의 그림을 보고 배웠다고 칩시다. 그런데 이 화가가 "나에게 '스미스 씨의 초상화'를 그려줘"라고 하면, 스미스 씨가 실제로 찍은 사진과 똑같은 그림을 그려냅니다.

이건 마치 학생이 시험 문제를 외워서 답을 그대로 적어내는 것과 같습니다.

  • 문제점: 만약 그 '스미스 씨의 초상화'가 누군가의 사생활이거나 저작권이 있는 그림이라면, AI 가 똑같이 그려내는 것은 사생활 침해저작권 위반이 될 수 있습니다.
  • 기존 방법들의 한계:
    • 학습 단계에서 막기: 처음부터 AI 를 가르칠 때 "이건 외우지 마"라고 시키는 건, AI 가 아직 어떤 걸 외울지 모르는 상태에서 막무가내로 모든 걸 제한하는 것이어서 AI 의 창의성 (품질) 이 떨어집니다.
    • 학습 후 지우기: 이미 배운 AI 에서 특정 기억을 지우려고 노력하는 건, 머리를 수술하듯 무겁고 비싸며, 완전히 지워지지 않아 다시 튀어나올 수도 있습니다.

2. 새로운 해결책: GUARD (가드)

이 논문은 **"AI 의 머릿속을 고치는 게 아니라, 그림을 그리는 '순간'의 행동만 살짝 수정하자"**고 제안합니다. 이를 GUARD라고 부릅니다.

GUARD 의 원리: '밀어내기'와 '당겨주기'
AI 가 그림을 그리는 과정은 소음을 제거하며 선명한 그림을 만들어가는 과정입니다. GUARD 는 이 과정에서 두 가지 힘을 작용시킵니다.

  1. 밀어내기 (Repulsion): "아니야, 그건 원래 훈련 데이터에 있던 그림이야! 그쪽으로 가면 안 돼!"라고 AI 를 원래의 훈련 데이터 (기억) 에서 밀어냅니다.
  2. 당겨주기 (Attraction): "그 대신, 너의 요청 (프롬프트) 에 맞는 새롭고 멋진 그림으로 가자!"라고 안전한 목표 지점으로 AI 를 끌어당깁니다.

이 두 가지 힘을 동시에 쓰면, AI 는 원래의 그림을 베끼지 않으면서도 사용자의 요청에 맞는 고품질 그림을 그릴 수 있게 됩니다.

3. 핵심 기술: "어디를 수술할지 찾아내는 정밀 탐정"

그런데 여기서 중요한 질문이 생깁니다. "어떤 부분을 밀어내고 당겨줘야 할까?"

기존 연구들은 "글의 끝에 있는 특정 단어 (예: 문장 부호) 만 보면 안 돼"라고 정해두었습니다. 하지만 이 논문은 **"그건 틀렸어! 기억을 유발하는 단어는 그림마다, 상황마다 달라"**라고 말합니다.

  • 비유: AI 가 그림을 그릴 때, 어떤 단어는 마치 마법의 지팡이처럼 작동해서 훈련 데이터를 바로 불러옵니다.
    • 어떤 그림에서는 "고양이"라는 단어가 지팡이 역할을 할 수도 있고,
    • 다른 그림에서는 "파란색"이라는 단어가 지팡이 역할을 할 수도 있습니다.
    • 심지어 문장 끝의 부호 (EOT 토큰) 가 지팡이 역할을 하기도 합니다.

GUARD 의 혁신:
이 논문은 **"실시간 탐정"**을 도입했습니다. AI 가 그림을 그리는 순간순간, **"어떤 단어가 지금 가장 큰 주목 (Attention) 을 받고 있어?"**를 분석합니다.

  • 만약 특정 단어가 비정상적으로 큰 주목을 받고 있다면, 그 단어가 **기억을 불러일으키는 '지팡이'**일 가능성이 높습니다.
  • GUARD 는 그 특정 단어의 주목도만 '수술'하듯 살짝 줄여줍니다. (나머지 단어들은 그대로 둡니다.)

이렇게 하면 AI 는 "아, 이 단어는 너무 크게 보지 말아야겠다"라고 생각하며, 훈련 데이터를 베끼지 않는 새로운 그림을 그리게 됩니다.

4. 왜 이것이 특별한가요?

  • 정밀한 수술 (Surgical): AI 전체를 고치는 게 아니라, 필요한 부분만 딱 집어서 수정합니다. 그래서 그림의 품질이 떨어지지 않습니다.
  • 유연함 (Dynamic): 그림마다, 요청마다 달라지는 '기억의 지팡이'를 실시간으로 찾아냅니다.
  • 효율성: AI 를 다시 학습시킬 필요 없이, 그림을 그리는 순간에만 적용하면 됩니다.

📝 한 줄 요약

"AI 가 훈련 데이터를 그대로 베끼는 것을 막기 위해, 그림을 그리는 순간 '기억을 불러오는 특정 단어'만 실시간으로 찾아내어 그 힘만 살짝 누르는 정밀 수술법을 개발했습니다."

이 방법은 AI 가 사용자의 요청에 따라 멋진 그림을 그리면서도, 저작권이나 사생활 문제를 일으키는 원본 그림을 베끼지 않도록 도와줍니다. 마치 AI 화가에게 "그림은 잘 그려줘도 되는데, 그 특정 사진은 절대 베끼지 마!"라고 귀에 대고 속삭여주는 것과 같습니다.