Wasserstein Distances Made Explainable: Insights Into Dataset Shifts and Transport Phenomena

이 논문은 Wasserstein 거리가 데이터 분포 간 차이를 정량화할 수 있지만 그 원인을 설명하기 어렵다는 한계를 극복하기 위해, 설명 가능한 AI 기법을 활용하여 해당 거리를 데이터 하위 그룹, 입력 특성 또는 해석 가능한 부분 공간과 같은 구성 요소에 효율적으로 귀속시키는 새로운 방법을 제안합니다.

Philip Naumann, Jacob Kauffmann, Grégoire Montavon

게시일 2026-03-03
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🌊 1. 문제 상황: "두 강물의 차이"를 숫자로만 알 수 있다?

가상 상황을 상상해 보세요.

  • 강 A (Source): 아침에 흐르는 맑은 강물입니다.
  • 강 B (Target): 오후에 흐르는 강물인데, 중간에 폭포가 있고, 물살이 세지며, 어떤 곳은 모래가 쌓여 있습니다.

우리는 이 두 강물의 상태를 비교할 때, 단순히 "두 강물의 거리는 50km 입니다"라고 숫자만 알려준다면 어떨까요?

  • "어디가 50km 차이 나는 거지?"
  • "폭포 때문일까? 모래 때문일까?"
  • "물살이 세진 건 왜일까?"

기존의 워터스틴 거리는 두 강물 (데이터) 의 차이를 계산하는 아주 정교한 자입니다. 하지만 이 자는 **"차이의 총합"**만 알려줄 뿐, **"어떤 부분이 그 차이를 만든 주범인지"**는 알려주지 않습니다. 마치 "이 집의 전기세는 10 만 원이다"라고만 알려주고, "에어컨이 8 만 원, 냉장고가 2 만 원이다"라고 알려주지 않는 것과 같습니다.

💡 2. 해결책: "WaX (워터스틴 설명기)"의 등장

이 논문은 **WaX (Wasserstein Distances Made Explainable)**라는 새로운 방법을 제안합니다.
WaX 는 **"전기세 명세서"**처럼, 두 데이터 세트의 차이 (워터스틴 거리) 가 어떤 특징 (Feature) 이나 어떤 데이터 포인트 때문에 생겼는지 세세하게 설명해 줍니다.

🏗️ 비유: 건물의 구조를 뒤집어 보기

WaX 는 복잡한 수식을 마치 레고 블록으로 만든 기계처럼 다시 조립합니다.

  1. 기계 분해 (Neuralization): 워터스틴 거리를 계산하는 복잡한 과정을, 신경망 (Neural Network) 이라는 레고 구조로 바꿉니다.
  2. 역주행 (Propagation): 기계가 작동한 결과 (거리 값) 를 보고, 그 원인이 된 레고 블록 (데이터의 특징) 들로 거꾸로 추적합니다.
    • "아! 이 레고 블록 (예: '키'라는 특징) 이 30% 를 차지했구나!"
    • "이 블록 (예: '나이'라는 특징) 이 70% 를 차지했구나!"

이렇게 하면 **"두 데이터가 다른 이유는 '키' 차이 때문이지, '나이' 때문이 아니야!"**라고 명확하게 알 수 있게 됩니다.


🚀 3. WaX 가 실제로 어떤 일을 해내나? (세 가지 사례)

이 기술은 실제로 매우 유용하게 쓰입니다.

🛠️ 사례 1: "나쁜 친구"를 찾아내서 버리기 (도메인 적응)

  • 상황: 한 병원에서 만든 AI 가 다른 병원에 적용될 때, 병원의 벽색이나 조명 같은 '불필요한 차이' 때문에 오작동할 수 있습니다.
  • WaX 의 역할: "이 AI 가 병원의 벽색 (불필요한 특징) 때문에 판단을 잘못하고 있어! 이 부분을 잘라내자!"라고 알려줍니다.
  • 결과: 불필요한 특징을 제거하면 AI 는 더 똑똑하고 튼튼해집니다.

🐌 사례 2: "오징어"가 어떻게 자라나? (이해하기 어려운 현상 분석)

  • 상황: 작은 오징어 (데이터) 가 1 년 뒤 커진 오징어로 변하는 과정을 관찰합니다.
  • WaX 의 역할: 단순히 "커졌다"가 아니라, **"작은 오징어들은 '무게'가 많이 늘었지만, 큰 오징어들은 '길이'가 더 많이 늘었다"**는 식으로, 그룹별로 어떻게 변했는지 세분화해서 보여줍니다.
  • 결과: 복잡한 생물의 성장 과정을 '하드'하게 쪼개서 이해할 수 있게 됩니다.

📸 사례 3: "사진첩"의 차이 찾기 (데이터셋 비교)

  • 상황: '셀럽 사진 (CelebA)'과 '야외 인물 사진 (LFW)' 두 가지 사진 데이터가 있습니다.
  • WaX 의 역할: 두 사진첩의 차이를 분석합니다.
    • "셀럽 사진에는 여배우들이 많고, 야외 사진에는 정치인이나 남성이 많네."
    • "셀럽 사진에는 선글라스를 쓴 사람이 많고, 야외 사진에는 테니스를 치는 사람이 있네."
  • 결과: 데이터 세트가 어떤 편향을 가지고 있는지, 어떤 주제가 빠졌는지 한눈에 파악할 수 있습니다.

🌟 4. 왜 이것이 중요한가요?

과거에는 "두 데이터가 다르다"는 사실만 알 수 있었습니다. 하지만 WaX"왜, 어디서, 어떻게" 다른지 이해할 수 있게 (Explainable) 만들어줍니다.

  • 투명성: AI 가 왜 그런 판단을 내렸는지, 데이터가 왜 다른지 그 이유를 투명하게 보여줍니다.
  • 신뢰성: 의료나 과학 같은 중요한 분야에서, 데이터의 차이를 정확히 이해해야만 신뢰할 수 있는 결정을 내릴 수 있습니다.
  • 효율성: 불필요한 데이터를 제거하고, 진짜 중요한 부분에만 집중하게 도와줍니다.

📝 한 줄 요약

"WaX 는 두 데이터 세트의 '거리'를 계산하는 자를, 그 거리가 '왜' 생겼는지 설명해주는 '해설가'로 만들어주는 기술입니다."

이 기술 덕분에 우리는 이제 데이터의 차이를 단순히 숫자로만 보는 것이 아니라, 그 이면에 숨겨진 이야기와 원인을 깊이 있게 이해할 수 있게 되었습니다.