Attribution as Retrieval: Model-Agnostic AI-Generated Image Attribution

이 논문은 기존 방법의 모델 의존성 한계를 극복하기 위해 AI 생성 이미지 출처 추적을 이미지 분류가 아닌 인스턴스 검색 문제로 재정의하고, 저비트 지문 생성과 비지도 사전 학습을 기반으로 한 모델 독립적 프레임워크 'LIDA'를 제안하여 제로샷 및 퓨샷 환경에서 최첨단 성능을 달성함을 보여줍니다.

Hongsong Wang, Renxi Cheng, Chaolei Han, Jie Gui

게시일 2026-03-12
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"AI 가 만든 그림이 도대체 누가 그렸는지 알아내는 새로운 방법"**을 소개합니다.

기존의 방법들은 마치 "새로운 범죄자가 나타나면 경찰이 그 사람을 잡기 위해 다시 수백 번 훈련을 받아야 하는" 것처럼 비효율적이었습니다. 하지만 이 연구팀이 제안한 LIDA라는 방법은 **"지문 감식"**과 **"검색 엔진"**을 결합한 똑똑한 방식을 사용합니다.

이해하기 쉽게 세 가지 핵심 비유로 설명해 드릴게요.


1. 문제: "새로운 가짜 그림이 쏟아지는데, 어떻게 잡지?"

지금 AI 그림 (Midjourney, Stable Diffusion 등) 이 너무 잘 그려져서 진짜인지 가짜인지 구별하기 어렵습니다. 게다가 새로운 AI 프로그램이 매일 새로 나오는데, 기존 기술들은 "이 프로그램은 알고 있지만, 저건 모르겠다"라고 하거나, 새로운 프로그램을 잡으려면 다시 처음부터 공부를 시켜야 (훈련을 받아야) 했습니다.

2. 해결책 1: "보이지 않는 지문"을 찾아라 (Low-Bit Fingerprint)

우리가 사람 얼굴을 보면 눈, 코, 입이 보입니다. 하지만 LIDA는 그림의 '표면'을 보지 않습니다. 대신 그림을 구성하는 아주 미세한 **색깔의 잔해 (비트)**만 남깁니다.

  • 비유: 그림을 한 장의 종이라고 생각해보세요. 보통 우리는 종이에 그려진 '그림'만 봅니다. 하지만 LIDA 는 종이를 매우 약한 빛으로 비춰서, 종이에 묻어 있는 '잉크의 미세한 흔적'만 남깁니다.
  • 이 흔적은 그림의 내용 (예: 하늘, 새) 과는 상관없이, **그림을 만든 AI 프로그램마다 고유하게 남기는 '지문'**과 같습니다.
  • 이 지문은 AI 가 그림을 그릴 때 실수로 남기는 '노이즈'인데, LIDA 는 이 노이즈만 잘라내어 **'지문 이미지'**로 만듭니다.

3. 해결책 2: "검색 엔진"처럼 작동하라 (Retrieval, not Classification)

기존 방식은 "이 그림은 A 프로그램이 그렸나요? B 프로그램이 그렸나요?"라고 **시험을 치는 방식 (분류)**이었습니다. 새로운 프로그램이 나오면 시험 문제지를 다시 만들어야 했습니다.

하지만 LIDA 는 검색 엔진처럼 작동합니다.

  • 비유: 경찰이 범인을 잡을 때, "범인은 A, B, C 중 누구일 거야?"라고 추측하는 게 아니라, **"수사국에 있는 모든 범인 지문 데이터베이스"**를 가지고 있습니다.
  • 새로운 그림이 들어오면, LIDA 는 그 그림의 '지문'을 추출해서 데이터베이스에 있는 수천 개의 지문과 **비교 (검색)**합니다.
  • "아! 이 지문은 'Midjourney'라는 데이터에 있는 지문과 95% 비슷하네!"라고 찾아냅니다.
  • 장점: 새로운 AI 프로그램이 나오면? 그 프로그램으로 그린 그림을 하나만 데이터베이스에 추가하면 됩니다. 다시 공부를 시킬 필요 없이, 바로 검색해서 찾아낼 수 있습니다.

4. 해결책 3: "스무고개"가 아니라 "한 번에 적응" (Few-Shot)

이 방법은 아주 적은 양의 데이터로도 작동합니다.

  • 비유: 새로운 범죄자가 생겼다고 해서 경찰이 수천 시간 동안 훈련할 필요가 없습니다. 그 범죄자의 사진 (지문) 을 딱 1 장만 찍어서 파일에 넣으면, 그 다음부터는 그 사람을 바로 알아볼 수 있습니다.
  • 이 논문에서는 새로운 AI 프로그램으로 만든 그림을 단 1 장~10 장만 보여주면, AI 가 그 프로그램의 특징을 금방 익혀서 다른 그림들도 찾아낼 수 있다고 합니다.

요약: 왜 이것이 혁신적인가?

  1. 누구나 쓸 수 있음 (Model-Agnostic): 어떤 AI 프로그램이든 상관없이 작동합니다.
  2. 빠른 적응: 새로운 AI 가 나오면 다시 훈련할 필요 없이, 그림 몇 장만 등록하면 바로 찾아냅니다.
  3. 정확한 증거: 단순히 "가짜다"라고 말하는 게 아니라, **"어떤 프로그램이 그렸는지"**를 찾아내어 그 이유 (유사한 지문) 를 보여줍니다.

결론적으로, 이 기술은 AI 가 만든 가짜 그림이 넘쳐나는 시대에, "누가 그렸는지"를 지문 감식하듯 빠르고 정확하게 찾아내는 초강력 수사관과 같습니다.