Counterfactual Explanations on Robust Perceptual Geodesics

이 논문은 Wachter 등 의 기존 방법론이 가진 거리 측정의 모호성과 오프-매니폴드 문제를 해결하기 위해, 견고한 비전 특징에서 유도된 지각적 리만 계량 하의 측지선을 따라 반사실 설명을 생성하는 '지각적 반사실 측지선 (PCG)'을 제안하고, 이를 통해 인간 지각과 정렬된 매끄럽고 의미 있는 전환을 가능하게 함을 보여줍니다.

Eslam Zaher, Maciej Trzaskowski, Quan Nguyen, Fred Roosta

게시일 2026-03-03
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🎨 핵심 비유: "AI 의 눈으로 본 지도와 길 찾기"

상상해 보세요. AI 가 세상을 볼 때, 우리 눈에는 보이지 않는 거대한 지도가 있다고 칩시다. 이 지도에는 '고양이'가 사는 마을과 '개'가 사는 마을이 있습니다.

기존의 AI 설명 방법들은 이 지도를 잘못 이해하고 있었습니다.

  1. 기존 방법의 문제 (뚫린 지름길): "고양이 사진을 개 사진으로 바꾸려면?"이라고 물으면, 기존 AI 는 지도의 지름길을 찾아냅니다. 하지만 이 지름길은 지도 밖으로 나가버리는 경우가 많습니다. (예: 고양이의 귀를 뚝 잘라버리거나, 피부색을 비정상적으로 변색시키는 등). 이는 AI 가 "아, 이걸로 분류가 바뀌네!"라고 착각하게 만드는 **허위 신호 (Adversarial Attack)**일 뿐, 실제 개가 아닙니다.
  2. 새로운 방법 (PCG): 이 논문은 **"Robust Perceptual Geodesics(견고한 지각 지선)"**라는 새로운 나침반을 개발했습니다. 이 나침반은 AI 가 아니라 사람의 눈과 뇌가 세상을 어떻게 인식하는지를 기준으로 길을 잡습니다.

🚗 구체적인 이야기: "고양이에서 개로 변신하기"

이제 이 비유를 실제 상황에 적용해 보겠습니다.

1. 문제 상황: 엉뚱한 길로 가는 차 (기존 방법)

기존의 AI 설명 도구들은 고양이를 개로 바꾸고 싶을 때, 지도의 평평한 직선을 따라 갑니다.

  • 결과: 차가 도로 (데이터의 자연스러운 흐름) 를 벗어납니다.
  • 현상: 고양이의 얼굴이 길어지거나, 눈이 비틀어지거나, 털이 이상하게 날리는 등 불자연스러운 변형이 생깁니다.
  • 비유: "고양이를 개로 바꾸자!"라고 해서 고양이의 귀를 잘라내고 코를 찌그러뜨린 결과, AI 가 "아, 이건 개네!"라고 착각하는 상황입니다. 하지만 사람 눈에는 여전히 기괴한 고양이일 뿐입니다.

2. 새로운 해결책: PCG (이 논문의 방법)

저자들은 **"AI 가 속지 않는 튼튼한 지도"**를 만들었습니다. 이 지도는 AI 가 공격에 약한 부분 (예: 픽셀의 미세한 변화) 을 무시하고, **사람이 실제로 중요하게 여기는 특징 (귀 모양, 털 결, 얼굴 구조)**을 따라 길을 안내합니다.

  • 두 단계 과정:

    1. 1 단계 (길 찾기): 고양이 마을에서 개 마을까지, 자연스러운 길을 그립니다. 중간에 차가 도로를 벗어나지 않도록 부드럽게 연결합니다.
    2. 2 단계 (최종 도착): 그 길 위에서, 고양이와 가장 비슷한 개를 찾습니다. 너무 멀리 가지도, 너무 가깝지도 않게 최적의 지점을 찾습니다.
  • 결과: 고양이의 귀 모양이 조금씩 변하고, 털 결이 바뀌면서 자연스럽게 개로 변합니다. 중간 과정에서도 "아, 이건 고양이에서 개로 변하는 과정이구나"라고 사람이 이해할 수 있습니다.


💡 왜 이것이 중요한가요?

이 논문의 핵심 메시지는 **"진짜 설명은 사람이 이해할 수 있어야 한다"**는 것입니다.

  • 기존의 문제: AI 가 "이 픽셀을 0.01 만큼 바꾸면 개로 바뀐다"고 말하면, 그것은 기술적으로는 맞지만 사람에게는 아무런 의미가 없습니다. (마치 "이 약을 0.001mg 더 먹으면 병이 낫는다"고 하지만, 실제로는 그 양은 아무 효과도 없는 것처럼요.)
  • 이 논문의 기여: AI 가 **"고양이의 귀를 조금 더 뾰족하게 하고, 턱선을 넓히면 개가 됩니다"**라고 설명해 줍니다. 이는 사람이 상상할 수 있는 의미 있는 변화입니다.

🏆 요약: 이 논문이 한 일

  1. 나쁜 길 (Adversarial) 을 막았다: AI 가 속아 넘어가는 기만적인 길 (도로 밖으로 나가는 길) 을 막았습니다.
  2. 좋은 길 (Geodesic) 을 만들었다: 사람의 눈과 뇌가 자연스럽게 인식하는 부드러운 길을 만들었습니다.
  3. 결과: AI 가 왜 그런 판단을 내렸는지, 그리고 어떻게 바꾸면 다른 판단을 내릴지를 사람이 이해할 수 있는 방식으로 보여줍니다.

한 줄 요약:

"이 논문은 AI 가 이미지를 바꿀 때, 기괴한 변형 없이 사람이 자연스럽게 이해할 수 있는 길을 찾아주는 새로운 나침반을 만들었습니다."