Beyond Semantic Similarity: Open Challenges for Embedding-Based Creative Process Analysis Across AI Design Tools

이 논문은 AI 기반 창의성 지원 도구의 평가에 있어 단순한 의미적 유사성 기반 임베딩 분석의 한계를 지적하고, 창의적 전환을 포착하기 위한 문맥 인식 개입과 같은 새로운 과제를 제시합니다.

Seung Won Lee, Semin Jin, Kyung Hoon Hyun

게시일 Tue, 10 Ma
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 "AI 디자인 도구들이 얼마나 창의적인지 어떻게 비교할 것인가?" 라는 아주 중요한 질문을 던집니다.

기존에는 각 디자인 분야 (예: 폰트 만들기, 가구 디자인, 건축 등) 마다 다른 기준으로 평가했기 때문에, "A 도구가 B 도구보다 더 창의적인가?"라고 비교하는 것이 거의 불가능했습니다. 이 논문은 모든 디자인 과정을 하나의 공통된 언어로 번역해서 비교할 수 있는 방법 (임베딩 분석) 을 제안하지만, 동시에 "그 방법이 아직 완벽하지 않다" 고 경고합니다.

이 복잡한 내용을 일상적인 비유로 쉽게 설명해 드릴게요.


🎨 비유: "창의성 지도 만들기"

가상적으로 우리가 창의적인 여행 (디자인 과정) 을 기록하는 지도를 만든다고 상상해 보세요.

1. 현재의 문제: "단어만 보고 길을 잘못 판단하다"

지금까지 AI 는 여행자의 말을 들을 때, 비슷한 단어를 쓰면 같은 길로 간다고 생각했습니다.

  • 상황: 여행자가 "의자를 쌓는 방법"을 고민하다가, 갑자기 "벽을 쌓는 방법"으로 생각을 바꿨다고 칩시다.
  • AI 의 오해: AI 는 "의자"와 "벽"이라는 단어에 '쌓다 (Stackable)'라는 공통점이 있으니, 여행자가 같은 주제 (의자) 를 더 자세히 설명하는 중이라고 판단합니다.
  • 현실: 사실 여행자는 완전히 다른 문제 (공간 활용) 를 해결하기 위해 방향을 180 도 틀어준 것입니다.
  • 결과: AI 는 이 여행을 "한 가지 길을 계속 걷는 단순한 과정"으로 기록해 버려, 여행자가 얼마나 다양한 길을探索했는지 (창의성) 를 제대로 평가하지 못합니다.

2. 이 논문이 지적한 3 가지 큰 난관 (Open Challenges)

이 논문은 "단순히 단어의 뜻을 비교하는 것만으로는 부족하다"며 세 가지 문제를 꼽았습니다.

① "겉모습은 비슷하지만, 속은 완전히 다르다" (의미 vs 창의적 전환)

  • 비유: 두 사람이 모두 "커피를 마신다"고 말합니다. 한 사람은 "아침에 깨어나기 위해" 마셨고, 다른 사람은 "새로운 카페를 창업하기 위해" 마셨습니다.
  • 문제: AI 는 둘을 같은 행동으로 봅니다. 하지만 디자인에서는 문제를 바라보는 관점이 바뀌는 순간 (Pivot) 이 가장 중요한 창의적 순간입니다. AI 가 이 '관점의 전환'을 놓치면, 창의적인 지도는 엉터리가 됩니다.

② "글자만 읽을 수 없다" (멀티모달 문제)

  • 비유: 여행자가 말 (텍스트) 로만 설명하는 게 아니라, 손으로 그린 그림, 스케치, 사진도 남깁니다.
  • 문제: 지금 AI 는 그림과 그림을 비교할 때 "색깔이나 모양이 비슷하면 같은 길"이라고 생각합니다. 하지만 초보자의 투박한 스케치완성된 고화질 그림은 모양은 다르지만, 같은 아이디어의 발전일 수 있습니다.
  • 과제: 글자뿐만 아니라 그림, 소리 등 모든 자료를 섞어서 "어디서부터가 하나의 아이디어 (Move) 인가?"를 구분하는 새로운 규칙이 필요합니다.

③ "여행 가이드가 스스로 길을 만든다" (에이전트 AI 의 등장)

  • 비유: 이제 여행자가 혼자 가는 게 아니라, AI 가이드가 스스로 경로를 짜고 여행자를 안내합니다.
  • 문제: 만약 AI 가이드가 "다양한 경로를 보여줘야 해!"라고 설정되어 있다면, AI 가 만든 지도는 여행자의 창의성 때문이 아니라 AI 의 설정 때문에 복잡해 보일 수 있습니다.
  • 과제: "이 복잡한 길이 진짜 창의적인가, 아니면 AI 가 그냥 장난친 것인가?"를 구별할 수 있는 새로운 평가 기준이 필요합니다.

💡 이 논문이 제안하는 해결책

이 논문은 "AI 가 문맥을 이해하는 똑똑한 중재자 (LLM)" 를 도입하라고 제안합니다.

  • 기존 방식: "단어 A 와 단어 B 가 비슷하니 같은 길이다." (기계적)
  • 새로운 제안: "이 여행자가 지금 '의자'에서 '벽'으로 넘어간 이유는 방을 넓히기 위한 새로운 아이디어를 얻었기 때문이다. 그러니 이건 '새로운 길'로 표시해야 한다." (맥락 이해)

즉, AI 가 단순히 단어를 비교하는 것을 넘어, 디자인하는 사람의 의도와 상황 (컨텍스트) 을 이해해서 창의적인 지도를 그려주어야 한다는 것입니다.

📝 한 줄 요약

"단순히 비슷한 단어를 찾는 것만으로는 진정한 창의성을 측정할 수 없습니다. AI 가 디자인하는 사람의 '생각의 전환'과 '맥락'을 이해할 수 있도록 지능을 업그레이드해야만, 서로 다른 디자인 도구들의 창의성을 공정하게 비교할 수 있습니다."