What is Missing? Explaining Neurons Activated by Absent Concepts

이 논문은 기존 설명 가능한 인공지능 (XAI) 방법이 간과해 온 '개념의 부재'가 뉴런 활성화에 미치는 영향을 규명하고, 이를 탐지하기 위한 새로운 기법을 제안하여 모델 해석과 편향 제거를 개선하는 방법을 제시합니다.

Robin Hesse, Simone Schaub-Meyer, Janina Hesse, Bernt Schiele, Stefan Roth

게시일 Wed, 11 Ma
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"인공지능이 무엇을 '보지' 않았을 때, 그 '부재'를 어떻게 활용하는지"**에 대한 놀라운 발견을 담고 있습니다.

기존의 인공지능 (AI) 설명 기술은 주로 "무엇이 있기에" AI 가 그런 판단을 내렸는지 설명하는 데 집중했습니다. 하지만 이 논문은 "무엇이 없어서" AI 가 판단을 내리는 경우도 매우 흔하며, 기존 기술은 이를 놓치고 있었다고 지적합니다.

이 복잡한 개념을 쉽게 이해할 수 있도록 몇 가지 비유로 설명해 드리겠습니다.


1. 핵심 개념: "보이지 않는 단서" (Encoded Absence)

🕵️‍♂️ 비유: 형사 수사관
상상해 보세요. 형사가 범인을 잡으려 합니다.

  • 기존 AI 설명 (현존하는 단서): "범인은 붉은 모자를 썼다!"라고 말합니다. (이미지에 붉은 모자가 있어서 범인이라고 판단)
  • 이 논문이 발견한 것 (부재의 단서): "범인은 검은 모자를 쓰지 않았다!"라고 말합니다.

실제 세상은 이 두 가지가 모두 중요합니다. 예를 들어, '아일랜드 세터'라는 개의 종류를 구분할 때, AI 는 단순히 '아일랜드 세터 특유의 코'가 있는지 확인하는 것뿐만 아니라, **'다른 개종류 (예: 서식스 스패니얼) 의 특징이 없는지'**를 확인함으로써 더 정확하게 판단합니다.

AI 는 **"저것은 없다"**는 사실을 통해 **"이것은 맞다"**고 결론 내리는 경우가 많습니다. 이를 **'인코딩된 부재 (Encoded Absence)'**라고 부릅니다.

2. 문제점: 기존 기술의 실수

🔦 비유: 어두운 방에서 손전등
기존의 AI 설명 기술 (XAI) 은 마치 어두운 방에서 손전등을 비추는 것과 같습니다.

  • 기존 방식: 손전등이 비추는 곳 (이미지에 있는 것) 만 봅니다. "여기에 코가 있네! 그래서 아일랜드 세터구나!"라고 말합니다.
  • 문제점: 하지만 손전등은 **비추지 않는 곳 (부재)**을 보여줄 수 없습니다. "저기 검은 모자가 없으니까 아일랜드 세터구나!"라는 중요한 단서는 손전등에 비춰지지 않아서 설명되지 않습니다.

기존 기술은 AI 가 "없음"을 어떻게 활용하는지 보여주지 못해, AI 의 판단 과정을 불완전하게 설명해 왔습니다.

3. 해결책: "반대 방향"으로 비추기

저자들은 이 문제를 해결하기 위해 두 가지 간단한 방법을 제안했습니다.

🔍 방법 1: "없는 것을 찾아보기" (Non-target Attribution)

  • 기존: "이 개가 아일랜드 세터인 이유를 찾아봐." → (아일랜드 세터 사진만 봄)
  • 새로운 방법: "이 개가 아일랜드 세터가 아닌 다른 개 (예: 서식스 스패니얼) 인 이유를 찾아봐."
    • 이렇게 하면 AI 가 "아, 이 개는 서식스 스패니얼의 특징이 없으니까 아일랜드 세터라고 판단했구나!"라는 부재의 단서를 찾아낼 수 있습니다.

🎨 방법 2: "가장 싫어하는 것 찾기" (Feature Visualization through Minimization)

  • 기존: "이 뉴런을 가장 활발하게 만드는 이미지를 만들어봐." → (코가 있는 이미지)
  • 새로운 방법: "이 뉴런을 가장 침묵하게 만드는 이미지를 만들어봐."
    • AI 가 "이 뉴런을 끄려면 무엇이 있어야 하나?"를 생각하게 하면, AI 가 싫어하는 (즉, 없어야 하는) 특징이 무엇인지 알 수 있습니다. "아, 이 뉴런은 '검은 모자'가 있을 때 꺼지네! 그럼 이 뉴런은 '검은 모자가 없음'을 감지하는 거구나!"

4. 왜 이것이 중요할까요?

⚖️ 비유: 편견을 고치는 약
AI 는 종종 편견 (Bias) 을 가집니다.

  • 예시: 피부암 진단 AI 가 "색깔이 화려한 반점이 있으면 암이 아니다 (양성)"라고 잘못 배웠다면, 그 반점이 없으면 암이라고 잘못 판단할 수 있습니다.
  • 해결: 기존에는 "화려한 반점이 있으면 암이 아니다"라는 사실만 막았습니다. 하지만 이 논문의 방법을 쓰면, **"화려한 반점이 없으면 암이다"**라는 잘못된 추론도 함께 막을 수 있습니다. AI 가 '있는 것'과 '없는 것' 양쪽 모두를 올바르게 이해하도록 도와주어, 더 공정하고 정확한 AI 를 만들 수 있습니다.

5. 요약

이 논문은 **"AI 는 '없음'을 통해 세상을 이해한다"**는 사실을 밝혀냈습니다.

  • 기존: "무엇이 있기에" AI 가 판단했는지 설명함.
  • 새로운 발견: "무엇이 없기에" AI 가 판단하는 경우가 많음.
  • 해결: 기존 설명 기술에 "부재"를 찾아보는 간단한 방법을 추가하면, AI 의 숨겨진 사고 과정을 완전히 이해하고, 더 편견 없는 AI 를 만들 수 있음.

결론적으로, 우리는 이제 AI 가 "보이는 것"뿐만 아니라 "보이지 않는 것"까지 어떻게 보고 있는지를 제대로 설명할 수 있게 되었습니다.