Does AI See like Art Historians? Interpreting How Vision Language Models Recognize Artistic Style

이 논문은 컴퓨터 과학자와 미술사가의 협업을 통해 비전 - 언어 모델이 예술적 스타일을 인식하는 메커니즘을 분석한 결과, 추출된 개념의 90% 가 미술사가들에 의해 관련성이 있다고 평가되었으며, 모델이 때로는 형식적 대비와 같은 다른 방식으로 개념을 이해하여 스타일 예측에 성공함을 밝혔습니다.

Marvin Limpijankit, Milad Alshomary, Yassin Oulad Daoud, Amith Ananthram, Tim Trombley, Elias Stengel-Eskin, Mohit Bansal, Noam M. Elcott, Kathleen McKeown

게시일 2026-03-12
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"인공지능 **(AI)라는 흥미로운 질문에서 시작합니다.

단순히 "이 그림이 르네상스 시대 작품이야?"라고 맞추는 것을 넘어, AI 가 그 결론에 도달하기 위해 그림의 어떤 부분을 보고, 어떤 논리를 사용했는지를 해부한 연구입니다.

이 복잡한 내용을 요리책 레시피와 미술관 가이드의 비유를 들어 쉽게 설명해 드릴게요.


1. 연구의 배경: AI 는 그림을 어떻게 볼까?

우리는 그림을 볼 때 색감, 붓터치, 전체적인 구도 같은 '형식'과 무엇이 그려져 있는지 (사람, 풍경, 사물) 같은 '내용'을 함께 보며 스타일을 판단합니다.

하지만 AI 는 어떨까요?

  • 과거의 문제: AI 가 그림을 분류할 때는 정답을 맞췄을지라도, 그 이유가 "왜?"라는 질문에 답을 못 했습니다. 마치 요리사가 요리를 잘 만들어내는데, "왜 이 재료를 넣었는지" 설명을 못 하는 상황과 비슷합니다.
  • 이 연구의 목표: 연구진은 컴퓨터 과학자와 미술사학자가 손잡고, AI 의 머릿속을 들여다보았습니다. "AI 가 스타일을 판단할 때 실제로 어떤 '조각'을 보고 있을까?"를 찾아낸 것입니다.

2. 연구 방법: 그림을 16 조각으로 자르다

이 연구의 가장 창의적인 부분은 그림을 잘게 썰었다는 점입니다.

  • 비유: 거대한 캔버스 전체를 한 번에 보는 대신, 그림을 **4x4 격자 **(16 조각)로 잘라내어 각 조각마다 AI 가 무엇을 보고 있는지 분석했습니다.
  • 이유: 그림 전체를 보면 너무 복잡해서 AI 가 "어디를 보고 판단했는지" 알기 어렵습니다. 하지만 작은 조각으로 나누면, AI 가 "이 부분의 어두운 그림자"나 "이 부분의 나뭇잎 질감"에 반응한다는 것을 구체적으로 찾아낼 수 있습니다.
  • 결과: AI 는 그림 전체를 보면서도, 사실은 이 작은 **조각들의 특징 **(Concepts)을 조합해서 스타일을 판단하고 있었습니다.

3. 주요 발견: AI 와 미술사학자의 시선이 일치할까?

연구진은 찾아낸 AI 의 '시각적 특징들'을 실제 미술사학자 6 명에게 보여주고 평가를 받았습니다.

✅ 일치하는 점 (73% 는 의미 있음)

  • 결과: AI 가 찾아낸 특징 중 73% 는 미술사학자들도 "아, 이 부분은 스타일을 설명하는 데 의미 있는 특징이네"라고 인정했습니다.
  • 예시:
    • **형식 **(Form) 어두운 빛과 밝은 빛의 대비 (키아로스쿠로), 부드러운 붓터치, 특정 색감 등.
    • **내용 **(Content) 특정 사물 (예: 숲, 드레스, 인물) 이나 장면.
  • 의미: AI 는 단순히 무작위 패턴을 외운 것이 아니라, 인간 전문가가 사용하는 논리와 꽤나 닮은 방식으로 그림을 보고 있었습니다.

⚠️ 다른 점 (하지만 틀린 건 아님)

  • 흥미로운 오해: 가끔 AI 가 "이건 낭만주의 (Romanticism) 야!"라고 맞췄는데, 미술사학자는 "아니야, 이건 사실주의 (Realism) 야"라고 할 때가 있었습니다.
  • 이유: AI 는 내용을 보고 스타일을 추측하는 경향이 있었습니다.
    • 예시: AI 는 "숲과 나무가 나오면 낭만주의일 거야"라고 생각했습니다. 실제로 낭만주의 작품에 숲이 많기는 하지만, 사실주의 작품에도 숲이 나올 수 있거든요.
    • 해석: AI 는 **인간이 보지 않는 '형식적 유사성' **(예: 어두운 색과 밝은 색의 대비)을 통해 스타일을 맞히는 경우가 많았습니다. 미술사학자는 "그림의 주제 (숲)"를 보고 스타일을 구분하지만, AI 는 "그림의 빛과 그림자 패턴"을 보고 구분한 것입니다.

4. 결론: AI 는 인간과 다르게, 하지만 똑똑하게 본다

이 연구는 다음과 같은 결론을 내립니다.

  1. AI 는 '눈'을 가지고 있다: AI 는 그림을 분석할 때 인간 전문가가 사용하는 **약 90% 의 논리 **(관련성)를 공유하고 있습니다.
  2. 하지만 '시각'은 조금 다르다: AI 는 때로는 인간이 중요하게 생각하지 않는 세부적인 패턴 (예: 특정 질감, 명암의 대비)에 더 민감하게 반응합니다.
  3. 교훈: AI 가 예술을 이해하는 방식은 인간과 완전히 같지는 않지만, 완전히 엉뚱한 것도 아닙니다. AI 는 인간이 놓칠 수 있는 미세한 패턴들을 포착하여, 때로는 인간보다 더 정교하게 (혹은 다른 각도로) 스타일을 분류할 수 있습니다.

🎨 한 줄 요약

"AI 는 미술관 가이드 (미술사학자) 와 같은 언어로 그림을 설명할 수는 없지만, 그림의 숨겨진 패턴을 읽어내는 '제 3 의 눈'을 가지고 있어, 인간이 놓친 부분까지 함께 그림을 이해하고 있습니다."

이 연구는 AI 가 단순히 데이터를 외우는 기계가 아니라, 예술의 본질을 탐구하는 새로운 파트너가 될 수 있음을 보여줍니다.