Tracing Copied Pixels and Regularizing Patch Affinity in Copy Detection

이 논문은 편집된 콘텐츠의 기하학적 추적 가능성을 활용하여 픽셀 좌표 추적 모듈 (PixTrace) 과 겹침 비율을 기반으로 한 기하학적 대비 손실 (CopyNCE) 을 제안함으로써, 기존 시계열 대비 학습의 한계를 극복하고 이미지 복사 탐지 성능과 해석 가능성을 크게 향상시켰습니다.

Yichen Lu, Siwei Nie, Minlong Lu, Xudong Yang, Xiaobo Zhang, Peng Zhang

게시일 2026-02-26
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"이미지 복사 탐지 (Image Copy Detection)"**라는 문제를 해결하기 위해 개발된 새로운 기술에 대한 것입니다. 쉽게 말해, **"누가 내 사진을 도용했거나, 편집해서 다시 올렸는지 찾아내는 기술"**입니다.

기존의 방법들은 사진 전체를 비교하거나, 비슷한 부분을 대충 찾아내는 방식이라서, 사진이 잘라지거나 색이 바뀌거나 모양이 왜곡된 복잡한 편집에는 약했습니다. 이 논문은 **"픽셀 (화소) 의 발자국을 추적한다"**는 아이디어로 이 문제를 해결했습니다.

이 내용을 일상적인 비유로 설명해 드릴게요.


1. 문제: "도난당한 사진의 미스터리"

상상해 보세요. 누군가 당신의 소중한 사진을 가져가서 다음과 같이 편집했다고 칩시다.

  • 사진의 한 구역을 잘라내서 다른 곳에 붙임 (이미지 매칭)
  • 사진 전체를 비틀거나 기울임 (아핀 변환)
  • 색감을 완전히 바꿔버림 (컬러 지터)

기존의 탐정들 (기존 AI) 은 이 사진을 보고 "아, 이거 원래 사진이랑 비슷해 보이네?"라고 대충 추측만 합니다. 하지만 편집이 너무 정교하면 "아니야, 이건 완전히 다른 사진이야!"라고 잘못 판단하거나, "어디가 같은지 정확히 모르겠어"라고 헤매게 됩니다.

2. 해결책 1: "픽셀 추적기 (PixTrace)" - 도난당한 물건의 GPS

이 논문은 **"원본 사진의 픽셀 하나하나가 편집된 사진에서 어디로 갔는지 정확히 기록하는 시스템"**을 만들었습니다.

  • 비유: 원본 사진을 레고 블록으로 만든 성이라고 생각하세요. 누군가 이 성을 부수고, 블록을 잘라내서 다른 모양으로 다시 조립했다고 칩시다.
  • 기존 방식: "어? 저기 붉은 벽돌이 있네? 아마 원래 성에 있었을 거야."라고 대충 눈으로 찾는 것입니다.
  • 이 논문의 방식 (PixTrace): 각 레고 블록에 GPS 추적기를 달아두는 것입니다. "이 붉은 벽돌은 원래 3 층 2 열에 있었는데, 편집 후엔 5 층 1 열로 이동했어!"라고 정확한 좌표 기록을 남깁니다.

이렇게 하면 편집이 아무리 복잡해도, "이 부분이 원본의 어디에서 왔는지"를 100% 확신할 수 있게 됩니다.

3. 해결책 2: "정교한 비교기 (CopyNCE)" - GPS 기록을 활용한 재판

이제 GPS 기록 (PixTrace) 을 바탕으로 AI 를 훈련시킵니다. 이때 사용하는 것이 CopyNCE라는 새로운 학습 방법입니다.

  • 비유: 법정에 서 있는 상황입니다.
    • 기존 방식: "이 두 사진이 비슷해 보이니까 유죄!"라고 대충 판단합니다. (잘못된 증거로 인해 무죄인 사람을 유죄로 만들거나, 유죄인 사람을 놓치는 경우가 많음)
    • 이 논문의 방식: "이 두 사진의 **중첩된 부분 (겹치는 영역)**을 GPS 기록으로 확인해 보자. 원본의 48% 가 여기로 왔고, 20% 는 저기로 왔어. 이 비율에 맞춰서 두 사진이 얼마나 닮았는지 점수를 매기자."

즉, **"어디서 얼마나 많이 가져왔는지"**를 수학적으로 계산해서, AI 가 "이건 도용이 맞다!"라고 확신할 수 있도록 가르치는 것입니다.

4. 결과: "완벽한 탐정"

이 기술을 적용한 결과는 놀라웠습니다.

  • 성능: 기존에 가장 잘하던 방법들보다 훨씬 정확하게 도용된 사진을 찾아냈습니다. (DISC21 이라는 대회에서 1 위 수준)
  • 해석 가능성: 단순히 "유죄"라고만 말하는 게 아니라, **"어디가 도용되었는지"**를 시각적으로 보여줍니다. 마치 수사관이 "여기서 이 부분이 잘려서 붙여졌어"라고 지목하는 것처럼 말이죠.

5. 요약: 왜 이 기술이 특별한가요?

기존의 AI 는 **"대충 비슷해 보이니 도용인 것 같아"**라고 추측하는 수준이었다면, 이 논문은 **"이 픽셀은 원본의 A 지점에서 왔고, 저 픽셀은 B 지점에서 왔어. 그러니 100% 도용이야!"**라고 증거 기반으로 판단합니다.

한 줄 요약:

"도난당한 사진의 조각 하나하나에 GPS 를 달아, 편집된 흔적을 추적하고 정교하게 비교함으로써, 어떤 복잡한 변조도 놓치지 않는 초능력의 이미지 탐정을 만들었습니다."

이 기술은 저작권 보호, 위조 사진 탐지, 인터넷상의 불법 복제 콘텐츠 찾기 등 우리 일상에서 매우 중요한 역할을 할 것으로 기대됩니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →