What Helps---and What Hurts: Bidirectional Explanations for Vision Transformers

이 논문은 Vision Transformer 의 예측을 해석하기 위해 지지와 억제 신호를 모두 포착하는 양방향 활성화 매핑 기법인 BiCAM 을 제안하고, 이를 통해 모델의 국소화 정확도와 충실도를 향상시키며 재학습 없이 적대적 예제를 탐지할 수 있음을 입증합니다.

Qin Su, Tie Luo

게시일 2026-03-04
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🎨 1. 문제: AI 는 "왜" 그걸 보았는지 말해주지 않는다

지금까지의 AI(비전 트랜스포머) 는 사진을 보고 "이건 코끼리야!"라고 정답을 맞히는 데는 매우 뛰어났습니다. 하지만 코끼리라고 생각했는지는 설명하지 못했습니다. 마치 천재 학생이 시험 문제를 맞혔는데, "어떤 단서로 풀었는지"는 말해주지 않는 것과 같습니다.

기존의 설명 방법들은 AI 가 "코끼리라고 생각한 이유 (긍정적 신호)"만 보여줬습니다. 하지만 **"코끼리가 아니라고 생각한 이유 (부정적 신호)"**는 무시해버렸습니다.

  • 비유: 친구가 "이 사람은 나쁜 사람이야"라고 할 때, "왜 나쁜 사람인지 (나쁜 행동)"만 말해주고, "왜 착한 사람으로 오해받지 않았는지 (착한 행동)"는 말해주지 않는 것과 같습니다. 이건 불완전한 설명이죠.

💡 2. 해결책: "BiCAM" (양방향 설명 도구)

저자들은 BiCAM이라는 새로운 도구를 만들었습니다. 이 도구의 핵심은 두 가지 색으로 설명을 한다는 점입니다.

  • 🔴 빨간색 (지지하는 신호): "아, 여기가 코끼리구나!"라고 AI 가 확신하는 부분.
  • 🔵 파란색 (억제하는 신호): "아니, 여기는 코끼리가 아니야 (예를 들어 말이나 배경)"라고 AI 가 배제하는 부분.

창의적인 비유: "탐정 수사"
기존 방법은 "범인 (코끼리) 은 여기 있어!"라고 손가락만 가리켰습니다. 하지만 BiCAM은 탐정처럼 다음과 같이 말합니다.

"범인은 빨간색으로 표시된 이 코끼리 몸통에 있어요. 그리고 범인이 아닌 것은 파란색으로 표시된 저 말과 배경이에요. 그래서 저는 이 코끼리를 범인으로 확신합니다."

이렇게 **찬성 (빨강)**과 **반대 (파랑)**를 동시에 보여주면, AI 가 어떻게 판단했는지 훨씬 더 명확하고 논리적으로 이해할 수 있습니다.

⚖️ 3. 새로운 발견: "PNR" (정답 vs 오답의 비율)

BiCAM 을 통해 빨간색과 파란색의 균형을 분석하면, **위조된 사진 (적대적 예제)**을 잡아낼 수 있습니다.

  • 비유:
    • 진짜 사진: AI 는 "코끼리 (빨강)"를 보고 "말 (파랑)"을 확실히 배제합니다. 빨강과 파랑의 균형이 자연스럽습니다.
    • 위조된 사진 (해커가 변조한 것): AI 는 혼란스러워합니다. "코끼리도 아닌데, 말도 아닌데... 뭐지?" 하면서 빨강과 파랑이 뒤죽박죽 섞이거나, 불필요한 곳에 색이 퍼집니다.

저자들은 이 **빨강과 파랑의 비율 (PNR)**을 계산하는 간단한 공식을 만들었습니다. 이 비율이 비정상적으로 변하면, "아, 이건 해커가 조작한 사진이구나!"라고 재학습 없이도 바로 알아챌 수 있습니다.

🚀 4. 왜 이것이 중요한가요?

  1. 더 정확한 설명: AI 가 무엇을 보고 무엇을 배제했는지 모두 보여줘서, 신뢰할 수 있는 AI 를 만듭니다.
  2. 빠르고 가볍습니다: 복잡한 계산을 다시 할 필요 없이, 한 번만 지나가면 (Forward-Backward pass) 바로 결과를 줍니다.
  3. 보안 강화: 해커가 AI 를 속이려 할 때, 이 도구를 쓰면 쉽게 잡아낼 수 있습니다.

📝 요약

이 논문은 **"AI 가 무언가를 판단할 때, '무엇을 보았는지'뿐만 아니라 '무엇을 배제했는지'도 함께 보여주는 것"**이 중요하다고 말합니다.

마치 양쪽 눈으로 세상을 보는 것처럼, AI 의 판단 과정에 **찬성 (빨강)**과 **반대 (파랑)**의 시선을 모두 더함으로써, 우리는 AI 의 머릿속을 훨씬 더 선명하게 볼 수 있게 되었습니다. 이는 AI 가 우리 삶에 더 안전하게, 더 투명하게 쓰이도록 돕는 중요한 한 걸음입니다.