The Persistence of Cultural Memory: Investigating Multimodal Iconicity in Diffusion Models

이 논문은 생성형 AI 모델이 문화적 아이콘을 처리할 때 단순한 복제가 아닌 '인식'과 '구현'의 두 차원을 구분하는 새로운 평가 프레임워크와 '문화적 참조 변환 (CRT)' 지표를 제안하며, 모델의 행동이 학습 데이터 빈도뿐만 아니라 텍스트 고유성, 참조의 인기도, 제작 시기 등 다양한 요인에 의해 결정됨을 규명합니다.

Maria-Teresa De Rosa Palmini, Eva Cetinic

게시일 2026-03-09
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🎨 핵심 주제: "기억"과 "재해석"의 경계

상상해 보세요. 친구에게 **"달의 뒷면 (The Dark Side of the Moon)"**이라는 제목을 말하고 그림을 그려달라고 했어요.

  • 일반적인 AI: 진짜 달이나 우주선을 그릴지도 모릅니다. (글자 그대로의 뜻)
  • 문화적 기억을 가진 AI: 핑크 플로이드의 앨범 표지처럼 프리즘과 무지개를 그릴 것입니다. (우리가 공유하는 문화적 상징을 이해했기 때문)

이 연구는 AI 가 이런 **문화적 상징 (Multimodal Iconicity)**을 어떻게 처리하는지 분석합니다. AI 가 단순히 훈련 데이터를 **복사 (Memorization)**하는지, 아니면 문화를 **이해하고 변형 (Generalization)**하는지 구분하는 것이 핵심입니다.

🧩 연구의 비유: "요리사"와 "레시피"

이 논문의 저자들은 AI 를 유명한 요리를 만드는 요리사에 비유합니다.

  1. 문제 상황:

    • 우리가 "파스타"라고 하면 AI 는 보통 파스타를 그립니다. 하지만 "마마파스타 (Mamma Mia!)"라고 하면, 이탈리아의 바다와 햇살이 섞인 특정 분위기를 떠올립니다.
    • 기존 연구들은 AI 가 원본 그림을 **100% 똑같이 베꼈는지 (복제)**만 확인했습니다. 하지만 AI 가 원본의 분위기나 핵심 요소를 가져와서 새로운 그림으로 재창조했다면? 이건 '복제'가 아니라 '재해석'입니다.
  2. 새로운 평가 도구 (CRT):

    • 저자들은 이 두 가지를 구분하기 위해 **CRT(문화적 참조 변환)**라는 새로운 점수 시스템을 만들었습니다.
    • 인식 (Recognition): "아, 이 그림이 '어떤 유명한 작품'을 말하는구나!"라고 AI 가 알아챘는가? (예: 프리즘을 보고 앨범을 알아차림)
    • 구현 (Realization): "그걸 어떻게 그렸나?" (원본을 그대로 찍어냈는가? 아니면 새로운 스타일로 변형했는가?)

    비유:

    • 나쁜 요리사 (복제): 레시피를 그대로 베껴서 원본과 똑같은 요리를 냄비에서 꺼내옵니다. (저작권 문제 발생)
    • 훌륭한 요리사 (재해석): 레시피의 핵심 맛 (문화적 상징) 을 기억하지만, 자신만의 스타일로 새로운 요리를 만들어냅니다. (창의적)
    • 무능한 요리사 (무관심): "파스타"라고 했는데 김치를 그립니다. (문화적 맥락을 모름)

🔍 주요 발견 사항 (요리사들의 실력 비교)

저자들은 5 가지 다른 AI 모델 (Stable Diffusion, Imagen 등) 을 테스트했습니다.

  1. 모델마다 성격이 다릅니다:

    • 어떤 모델은 인식 능력은 뛰어나지만, 그림을 그릴 때 원본을 너무 많이 베끼는 경향이 있었습니다. (맛은 알지만 레시피를 그대로 베낌)
    • 어떤 모델은 원본을 베끼는 건 적지만, 정작 "어떤 작품인지"를 알아차리지 못했습니다. (새로운 걸 만들지만 주제와 다름)
    • Imagen 4SD3 같은 모델은 "원본의 맛을 알아채면서도, 새로운 스타일로 변형하는" 능력이 가장 뛰어났습니다.
  2. 단어를 바꿔도 알아맞히는가?

    • "The Scream (비명)"이라는 제목 대신 "The Shriek (비명)"이라는 동의어로 바꿔서 요청했습니다.
    • 대부분의 AI 는 단어가 바뀌면 그림을 못 그렸지만, Imagen 4는 단어가 바뀌어도 여전히 "비명"이라는 문화적 상징을 알아보고 그림을 잘 그렸습니다. 이는 AI 가 단순히 단어와 그림을 매칭하는 게 아니라, 의미를 이해하고 있음을 보여줍니다.
  3. 왜 어떤 그림은 잘 그리고 어떤 건 못 할까?

    • AI 가 잘 그리는 이유는 단순히 자주 봤기 때문만은 아닙니다.
    • 제목이 독특할수록, 오래된 명작일수록, 이미지가 기억에 잘 남을수록 AI 가 그 문화적 상징을 더 잘 알아맞혔습니다.

💡 결론: AI 는 단순한 복사기가 아니다

이 연구는 우리에게 중요한 메시지를 줍니다.

"AI 가 유명한 그림을 그릴 때, 그것이 **'저작권 위반인 복사'**인지, **'문화를 존중하는 재해석'**인지를 구분해야 합니다."

기존의 평가 방식은 AI 가 원본과 얼마나 닮았는지만 재서, 창의적인 변형을 '나쁜 복사'로 오해할 수도 있었습니다. 하지만 이 연구는 AI 가 문화를 어떻게 기억하고, 어떻게 새로운 형태로 만들어내는가를 보는 더 섬세한 눈을 필요로 한다고 말합니다.

한 줄 요약:

AI 는 단순히 유명한 그림을 '복사'하는 기계가 아니라, 우리가 공유하는 문화적 기억을 '이해'하고 '새롭게 표현'할 수 있는 잠재력을 가진 존재입니다. 이제 우리는 그 능력을 더 정교하게 평가해야 합니다.