SPGen: Stochastic scanpath generation for paintings using unsupervised domain adaptation

이 논문은 자연 장면과 예술 작품 간의 도메인 격차를 해소하기 위해 비지도 도메인 적응을 적용하고 확률적 요소를 모델링한 새로운 심층 학습 모델 SPGen 을 제안하여, 관람자의 그림 감상 시 시선 주행을 정확하게 예측하고 문화유산 보존에 기여하는 방법을 제시합니다.

Mohamed Amine Kerkouri, Marouane Tliba, Aladine Chetouani, Alessandro Bruno

게시일 2026-02-26
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

SPGen: 그림을 볼 때 눈이 어떻게 움직일지 예측하는 'AI 눈썰미'

이 논문은 **"사람들이 그림을 볼 때 눈이 어디를 먼저 보고, 어떻게 움직일지 AI 가 예측하는 방법"**을 소개합니다. 이를 위해 개발된 모델의 이름은 SPGen입니다.

이 복잡한 기술 이야기를 마치 미술관 가이드눈의 여행에 비유해서 쉽게 설명해 드릴게요.


1. 왜 이 연구가 필요할까요? (문화유산의 비밀)

우리가 박물관에 가서 명화를 볼 때, 눈은 무작위로 돌아다니는 게 아니라 아주 특별한 패턴을 따릅니다.

  • 눈의 여행 (스캔패스, Scanpath): 그림을 볼 때 눈이 멈추는 지점 (주목) 과 빠르게 이동하는 경로 (시선 이동) 를 연결한 것이 바로 '스캔패스'입니다.
  • 문제점: 사람들은 자연 풍경 (산, 바다, 고양이 사진) 을 볼 때와 고전 명화 (르네상스, 바로크 등) 를 볼 때 눈이 움직이는 방식이 다릅니다. 하지만 기존 AI 는 자연 풍경은 잘 알아도, 예술 작품은 잘 이해하지 못해 엉뚱한 곳을 바라보게 만들었습니다.

2. SPGen 이란 무엇인가요? (똑똑한 미술관 가이드)

SPGen 은 **"그림을 보고 사람의 눈이 어디로 갈지 시뮬레이션하는 AI 가이드"**입니다. 이 가이드는 두 가지 핵심 기술을 사용합니다.

① '무작위성'을 더하다 (주사위 놀이)

사람의 눈은 기계처럼 똑같은 경로를 걷지 않습니다. 같은 그림을 봐도 사람마다, 혹은 같은 사람이라도 오늘 컨디션에 따라 눈이 가는 곳이 조금씩 다릅니다.

  • 비유: SPGen 은 단순히 "여기를 봐"라고 딱 정해주는 게 아니라, **"여기서부터 시작해서 여기저기 둘러봐"**라고 **주사위 (랜덤 노이즈)**를 굴려서 다양한 시나리오를 만들어냅니다.
  • 온도 (Temperature) 조절: 이 주사위의 강도를 조절하는 '온도'가 있습니다. 온도가 낮으면 눈이 중앙에 집중되고, 온도가 높으면 눈이 그림 전체를 더 넓게 훑어봅니다.

② '자연'에서 '예술'로 배우기 (무감독 도메인 적응)

이게 이 연구의 가장 큰 마법입니다. AI 는 처음에 수만 장의 '자연 사진' (산, 강, 사람) 을 보고 눈의 움직임을 배웠습니다. 그런데 이제 '고전 명화'를 보여주고 싶을 때, AI 는 당황합니다. 자연 사진과 그림은 색감, 구도, 질감이 다르기 때문입니다.

  • 비유: 마치 한국에서 운전 면허를 뗀 사람이, 갑자기 독일에서 운전대를 잡는 상황과 같습니다. 도로 표지판 (데이터 분포) 이 다르기 때문입니다.
  • 해결책: SPGen 은 **미러링 (Gradient Reversal Layer)**이라는 기술을 썼습니다. AI 가 "이건 자연 사진이야, 아니면 그림이야?"를 구별하지 못하도록 훈련시킵니다. 그렇게 하면 AI 는 "자연"과 "그림"의 공통된 특징 (예: 밝은 곳, 얼굴, 중요한 사물) 만 남기고, 나머지 차이점은 무시하게 됩니다.
  • 결과: 자연 사진을 보고 배운 눈의 움직임을, 레이블 (정답) 이 없는 그림 데이터에도 그대로 적용할 수 있게 되었습니다.

3. 어떻게 작동하나요? (작동 원리)

  1. 사진을 보고 특징을 잡기 (MobileNet): 그림을 입력받으면 AI 가 그림의 중요한 부분 (얼굴, 사물, 색감) 을 찾아냅니다.
  2. 선입견을 더하기 (Learnable Priors): "사람은 보통 그림 중앙을 먼저 본다"는 인간의 습관 (중심 편향) 을 AI 가 스스로 학습해서 반영합니다.
  3. 눈의 경로를 그리기 (Fixation Selector): AI 가 "여기가 중요해!"라고 판단한 곳들을 연결해서 눈이 이동할 경로를 그립니다. 이때 랜덤 주사위를 굴려서 매번 조금씩 다른 경로를 만들어냅니다.

4. 결과는 어땠나요? (성공!)

  • 자연 사진: 기존 최고의 AI 들보다 더 정확하게 눈의 움직임을 예측했습니다.
  • 명화 (예술 작품): 자연 사진으로만 훈련된 AI 는 그림을 볼 때 엉뚱한 곳을 보았지만, SPGen 은 도메인 적응 기술을 통해 그림의 특성을 잘 이해했습니다.
    • 비유: 이전 AI 가 그림을 볼 때 "중앙만 뚫어지게 쳐다보는" 상태였다면, SPGen 은 "그림의 구도, 색감, 스토리를 이해하며 자연스럽게 시선을 이동시키는" 상태가 되었습니다.

5. 이 기술이 왜 중요할까요?

이 기술은 단순히 AI 연구에 그치지 않고 문화유산 보존에 큰 도움을 줍니다.

  • 가상 박물관: 사람들이 직접 박물관에 가지 않아도, AI 가 "이 그림을 보면 사람들은 이 부분에서 감동받았을 거야"라고 시뮬레이션해 줄 수 있습니다.
  • 예술 감성 분석: 왜 이 그림이 유명한지, 사람들이 어떤 부분에 주목하는지 과학적으로 분석할 수 있습니다.

요약

SPGen은 **"자연 사진에서 배운 눈의 움직임을, AI 가 스스로 그림의 세계에 맞춰 변신시켜, 마치 사람이 그림을 감상하듯 다양한 시선 경로를 만들어내는 똑똑한 AI"**입니다.

이 기술은 우리가 예술 작품을 어떻게 감상하는지 이해하는 새로운 창을 열어주며, 디지털 시대의 문화유산 보존과 감상에 큰 기여를 할 것으로 기대됩니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →