Using the Path of Least Resistance to Explain Deep Networks

이 논문은 직선 경로를 기반으로 한 기존 통합 기울기 (IG) 방법의 한계를 지적하고, 모델 유도 리만 계량을 도입하여 측지선을 따라 기울기를 적분하는 '지오데식 통합 기울기 (GIG)'라는 새로운 기법을 제안함으로써 더 정확한 특성 중요도 할당을 가능하게 합니다.

Sina Salek, Joseph Enguehard

게시일 2026-02-27
📖 4 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🚗 비유: "직진 vs 지형도"

AI 가 어떤 사진을 보고 "이건 제트기야!"라고 판단했다고 가정해 봅시다. 우리는 AI 가 제트기라고 생각했는지 궁금합니다. 예를 들어, 날개나 꼬리 부분 때문에 그렇게 판단한 걸까요?

1. 기존 방법 (Integrated Gradients): "직진하는 자동차"

기존에 가장 많이 쓰이던 방법은 **Integrated Gradients (IG)**입니다.

  • 상황: AI 가 "검은색 (아무것도 없는 상태)"에서 시작해서 "제트기 사진"까지 가는 길이라고 상상해 보세요.
  • 기존 방식: 이 방법은 **직선 (Straight Line)**으로만 갈 수 있는 자동차를 시켰습니다.
  • 문제점: 지도를 보지 않고 직선으로만 가면, 때로는 가파른 절벽이나 **미끄러운 진흙탕 (높은 기울기 영역)**을 지나치게 됩니다.
    • 예시: 제트기 사진에서 날개 부분은 중요하지 않은데, 직선 경로가 그 부분을 지나가면서 AI 가 "아, 이 부분이 중요하구나!"라고 오해하게 만들 수 있습니다. (논문 Fig 1 의 제트기 예시)
    • 마치 직진으로만 가다가 길을 잃고 엉뚱한 곳의 중요성을 과대평가하는 것과 같습니다.

2. 새로운 방법 (Geodesic Integrated Gradients): "현명한 내비게이션"

저자들은 이 문제를 해결하기 위해 **Geodesic Integrated Gradients (GIG)**라는 새로운 방법을 제안했습니다.

  • 새로운 방식: 이제 자동차에 **AI 가 만든 지형도 (리만 계량)**를 심어줍니다. 이 지형도는 AI 가 학습한 '경로'를 보여줍니다.
  • 원리: 이 지형도에서는 **가파른 절벽 (높은 기울기)**은 피하고, **평탄하고 안전한 길 (낮은 기울기)**을 따라가는 것이 가장 빠르고 효율적인 길 (최단 경로, 측지선) 입니다.
  • 결과: AI 는 "제트기"를 설명할 때, 직선으로 가다가 엉뚱한 곳 (날개) 을 중요하게 여기는 실수를 하지 않고, **진짜 중요한 부분 (기체 본체)**을 따라가는 가장 자연스러운 길을 찾습니다.

🧩 핵심 아이디어 3 가지

1. "저항이 적은 길" (Path of Least Resistance)

  • AI 가 학습한 공간은 평평한 종이처럼 매끄러운 게 아니라, 구불구불한 산과 계곡이 있는 지형과 같습니다.
  • 기존 방법은 무조건 직선으로 가려다 보니, AI 가 가장 민감하게 반응하는 '가파른 곳'을 잘못 해석했습니다.
  • 새로운 방법은 **AI 가 가장 편안하게 느끼는 길 (저항이 적은 길)**을 따라가므로, AI 의 진짜 생각을 더 정확하게 캐치합니다.

2. "상쇄되지 않는 진실" (No-Cancellation Completeness)

  • 기존 방법의 함정: 어떤 특징은 "매우 중요 (+100)"하고, 다른 특징은 "매우 부정적 (-100)"하다고 평가해서 합계가 0 이 되도록 만들 수 있습니다. 결과적으로 "전체적으로 중요하지 않네?"라고 오해할 수 있습니다. (돈을 벌고 또 잃어서 순이익이 0 인 것처럼요.)
  • 새로운 방법의 규칙: 저자들은 **"상쇄되지 않는 완전성 (NCC)"**이라는 새로운 규칙을 만들었습니다.
    • "어떤 특징이 중요하면, 그 중요도는 절대 다른 특징의 부정적 점수로 사라지지 않아야 해!"라고 요구합니다.
    • 이렇게 하면 AI 가 진짜로 중요하게 생각하는 부분을 숨기지 않고 명확하게 보여줍니다.

3. "두 가지 길 찾기 기술"

이론상으로는 완벽한 길 (측지선) 을 찾는 게 좋지만, 실제로는 너무 복잡합니다. 그래서 두 가지 방법을 썼습니다.

  • 작은 데이터 (2 차원 등): **k-NN (가장 가까운 이웃)**을 이용해 점과 점을 잇는 그물망으로 가장 짧은 길을 찾습니다. (지도 위의 점들을 연결하는 방식)
  • 큰 데이터 (이미지 등): **확률적 변분 추론 (SVI)**이라는 기술을 써서, AI 가 "에너지가 적은 (편안한) 길"을 스스로 찾아내도록 훈련시킵니다. (내비게이션이 실시간으로 최적 경로를 계산하는 방식)

📊 실험 결과: 왜 더 좋은가요?

저자들은 이 방법을 **합성 데이터 (달 모양 두 개를 구분하는 문제)**와 **실제 사진 (Pascal VOC 데이터셋)**으로 테스트했습니다.

  • 합성 데이터: AI 가 평평한 곳에서 직선 경로를 따라가면 엉뚱한 점에 중요도를 부여했지만, 새로운 방법은 모든 점에 똑같은 중요도를 부여하여 AI 의 진짜 행동을 정확히 반영했습니다.
  • 실제 사진: 제트기 사진에서 기존 방법은 배경이나 불필요한 부분까지 중요하게 여기는 실수를 했지만, 새로운 방법은 제트기 본체에 집중했습니다.
  • 성능: 기존 방법들보다 AI 가 어떤 특징을 보고 판단했는지 더 정확하게 설명해 주었습니다 (Comprehensiveness, Log-odds 지표에서 우세).

⚠️ 단점과 미래

  • 단점: 이 새로운 방법은 계산이 조금 더 복잡하고 시간이 더 걸립니다. (기존 방법보다 약 840 배 더 오래 걸릴 수도 있음)
  • 미래: 하지만 AI 가 중요한 결정을 내리는 상황 (의료, 자율주행 등) 에서는 정확성이 속도보다 중요합니다. 앞으로 더 빠른 알고리즘이 개발되면 이 방법이 표준이 될 가능성이 큽니다.

💡 한 줄 요약

"AI 가 왜 그런 결정을 내렸는지 설명할 때, 무조건 직선으로 가지 말고 AI 가 가장 편안하게 느끼는 '지형도'를 따라가면, 훨씬 더 정확하고 믿을 수 있는 설명을 얻을 수 있다."

이 연구는 AI 의 '블랙박스'를 여는 열쇠를 더 정교하게 다듬어 준 셈입니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →