Who Made This? Fake Detection and Source Attribution with Diffusion Features

이 논문은 사전 학습된 Stable Diffusion 모델의 특징을 활용하여 새로운 생성 모델에 대한 일반화 능력을 갖춘 경량 데이터 효율적 프레임워크인 FRIDA 를 제안하고, 이를 통해 AI 생성 이미지의 탐지와 소스 모델 추적을 동시에 수행하는 방법을 제시합니다.

Simone Bonechi, Paolo Andreini, Barbara Toniella Corradini

게시일 Wed, 11 Ma
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🕵️‍♂️ FRIDA: AI 가짜 사진 탐정단

과거에는 AI 가 만든 가짜 사진을 찾아내려면, 탐정 (AI 모델) 이 수많은 가짜 사진들을 공부하고 훈련시켜야 했습니다. 하지만 새로운 AI 가 매일 새로 나오면, 탐정은 다시 모든 것을 공부해야 해서 너무 느리고 비쌌습니다.

FRIDA 는 이 문제를 완전히 다른 방식으로 해결합니다. **"이미 가짜를 잘 아는 전문가를 고용하자"**는 아이디어입니다.

1. 핵심 아이디어: "이미지 프로토타입" (Image Prototype)

FRIDA 는 Stable Diffusion이라는 유명한 AI 그림 그리기 프로그램을 그대로 가져와서, 그림을 그리는 과정의 **'중간 단계'**를 훑어봅니다.

  • 비유: imagine 해보세요. 어떤 요리사가 요리를 할 때, 재료를 섞고 끓이는 과정에서 특유의 '냄새'나 '소음'이 나죠. FRIDA 는 그 요리사 (AI) 가 요리를 완성하기 직전에 내뿜는 **'특유의 흔적'**을 포착합니다.
  • 이 흔적은 매우 작고 간결한 데이터 (프로토타입) 로 변환됩니다. 마치 사진의 지문처럼요.

2. 두 가지 주요 임무

FRIDA 는 이 '흔적'을 이용해 두 가지 일을 합니다.

① 진짜 vs 가짜 구하기 (Fake Detection)

  • 방법: **k-NN (k-최근접 이웃)**이라는 아주 간단한 방식을 씁니다.
  • 비유: 새로운 사진이 들어오면, FRIDA 는 "이 사진의 지문이 내 손에 있는 가짜 사진 지문들과 비슷해?"라고 묻습니다.
    • "아, 이 지문은 내가 알고 있는 가짜 사진들과 너무 비슷하네? -> 가짜!"
    • "이건 전혀 다른데? -> 진짜!"
  • 장점: 이 방법은 새로운 AI 가 등장해도 재교육이 필요 없습니다. 그냥 새로운 가짜 사진 몇 장만 보여주고 "이것도 가짜야"라고 알려주면, 그 지문을 기억해두고 바로 찾아냅니다. 마치 새로운 위조 지폐를 한 장만 보여주면, 은행 직원이 그 특징을 보고 다른 위조 지폐도 바로 알아보는 것과 같습니다.

② 누가 그렸는지 찾아내기 (Source Attribution)

  • 방법: **MLP (작은 신경망)**라는 간단한 분류기를 사용합니다.
  • 비유: 가짜 사진이 맞다면, "이 그림을 그린 건 미드저니 (Midjourney) 가 맞나? 아니면 스테이블 디퓨전 (Stable Diffusion) 이나?"라고 추리합니다.
  • 결과: FRIDA 는 각 AI 모델이 남기는 아주 미세한 '필름'이나 '스타일'을 구별해냅니다. 예를 들어, 스테이블 디퓨전 1.4 버전과 1.5 버전은 너무 비슷해서 혼동하기도 하지만, 미드저니나 빅GAN 같은 다른 모델과는 확실히 다릅니다.

3. 왜 이 방법이 특별한가요? (기존 방법과의 차이)

  • 기존 방법 (무거운 트럭): 새로운 가짜 사진이 나오면, 거대한 AI 모델을 다시 훈련시켜야 했습니다. 데이터도 엄청 많이 필요하고, 시간도 오래 걸렸습니다.
  • FRIDA (스마트한 자전거):
    • 가볍습니다: 별도의 복잡한 훈련이 필요 없습니다.
    • 빠릅니다: 이미 훈련된 AI(Stable Diffusion) 의 내부 기능을 활용하기 때문에 계산이 빠릅니다.
    • 강합니다: 사진이 흐릿해지거나 (블러), 압축되거나 (JPEG), 노이즈가 섞여도 잘 찾아냅니다. 마치 좋은 탐정이 비가 오거나 눈이 와도 범인을 놓치지 않는 것과 같습니다.

4. 실험 결과 (성공 스토리)

연구진은 GenImage라는 거대한 테스트장에서 FRIDA 를 시험해 보았습니다.

  • 결과: 기존에 있던 최고의 탐정들보다 약 6% 더 정확하게 가짜를 찾아냈습니다.
  • 놀라운 점: 훈련 데이터가 아주 적어도 (1,000 장 정도) 최고의 성능을 냈습니다. 보통은 수만 장의 데이터가 필요한데, FRIDA 는 적은 데이터로도 충분히 잘합니다.
  • 미지의 적: 훈련 시 보지 못했던 최신 AI(예: Flux, SDv3.5 등) 가 만들어낸 그림도 잘 찾아냈습니다.

📝 한 줄 요약

FRIDA는 무거운 훈련 없이, 이미 AI 그림을 잘 그리는 '전문가'의 내부 지식을 활용해, 진짜 사진과 가짜 사진을 구별하고, 누가 그 가짜를 만들었는지까지 찾아내는 가볍고 똑똑한 탐정입니다.

이 기술은 앞으로 AI 가 만들어낸 가짜 뉴스나 위조된 사진이 넘쳐나는 세상에서, 우리가 무엇을 믿어야 할지 판단하는 데 큰 도움이 될 것입니다.