Locating and Editing Figure-Ground Organization in Vision Transformers

이 논문은 비전 트랜스포머 모델 BEiT 내부에서 국소적 기하학적 증거와 전역적 조직적 사전 지식 간의 갈등을 해결하는 '도형 - 배경 조직화'가 초기 및 중간 층에서는 모호하다가 후기 층에서 급격히 해소되며, 특히 L0H9 어텐션 헤드가 볼록성 편향을 유도하는 핵심 기능 단위임을 규명했습니다.

Stefan Arnold, René Gröbner

게시일 2026-03-09
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

1. 실험: "뾰족한 화살 vs 둥근 삼각형"의 싸움

연구자들은 인공지능 (비전 트랜스포머, BEiT) 에게 아주 기묘한 그림을 보여줬습니다.

  • 상황: 화살촉 모양 (뾰족한 끝이 안으로 들어간 모양) 이 있습니다.
  • 문제: 화살촉의 뾰족한 부분 (오목한 부분) 을 가렸습니다.
  • 질문: "가려진 부분을 어떻게 채워야 할까?"

여기서 두 가지 선택지가 생깁니다.

  1. 오목한 채우기: 원래 화살촉 모양을 그대로 복원하는 것 (국소적인 증거).
  2. 볼록한 채우기: 가려진 부분을 삼각형으로 막아서 둥글게 만드는 것 (전체적인 규칙).

인간은 보통 '볼록한 것 (삼각형)'을 앞쪽의 사물 (Figure) 로 보고, '오목한 것'을 뒤쪽 배경 (Ground) 으로 봅니다. 이를 '볼록성 편향'이라고 합니다. 연구자들은 인공지능도 이렇게 "삼각형으로 채우는 쪽"을 선호한다는 것을 확인했습니다.

비유: 마치 구멍 난 옷을 고를 때, 구멍을 그대로 둬서 옷의 원래 모양을 살리는지, 아니면 구멍을 꿰매서 옷을 둥글게 만드는지 고민하는 상황과 같습니다. 인공지능은 대부분 "꿰매서 둥글게 만드는 것"을 선택했습니다.


2. 탐정 작업: "누가 결정을 내렸을까?"

그렇다면, 인공지능 내부의 어떤 부품이 "삼각형으로 만들어야지!"라고 결정했을까요? 연구자들은 인공지능의 뇌 (내부 레이어) 를 해부했습니다.

  • 초반 레이어 (입구): 인공지능이 그림을 처음 보는 순간에는, "삼각형일까? 화살촉일까?"라고 아직 결정하지 못하고 고민 중이었습니다.
  • 후반 레이어 (출구): 마지막 단계에 와서야 "아, 삼각형이야!"라고 확실히 결정했습니다.

핵심 발견:
그런데 흥미로운 점은, 결정을 내리기 훨씬 전인 아주 초반에 특정 부품 하나가 아주 작은 신호를 보냈다는 것입니다.

  • L0H9 라는 부품: 이 부품은 그림을 처음 보는 순간, 아주 미세하게 "삼각형 쪽으로 기울어라"라는 신호를 보냈습니다.
  • 비유: 마치 회의실 문이 열리기 전에, 한 사람이 "아마도 A 안이 좋을 거야"라고 아주 작게 속삭인 것과 같습니다. 그 말은 처음엔 작지만, 시간이 지나며 다른 사람들이 그 말을 듣고 "맞아, A 가 좋겠네"라고 따라 말하며 점점 커져 결국 A 를 선택하게 만드는 시작점 (Seed) 역할을 했습니다.

3. 조작 실험: "부품의 볼륨을 조절하다"

연구자들은 이 '시작점'이 진짜로 중요한지 확인하기 위해 실험을 했습니다.

  • 조작: L0H9 라는 부품의 신호를 약하게 줄였습니다 (볼륨을 낮췄습니다).
  • 결과: 놀랍게도 인공지능의 생각이 180 도 바뀌었습니다!
    • 원래는 "삼각형으로 채워야지"라고 했던 인공지능이, 이 부품을 약하게 만들자 **"아니야, 원래 화살촉 모양으로 채워야 해"**라고 결론 내렸습니다.

비유: 회의에서 "A 안이 좋겠다"라고 속삭이던 핵심 인물의 입을 막거나 목소리를 작게 만들자, 회의 전체가 "그럼 B 안 (화살촉) 으로 가자"라고 결론을 내린 것과 같습니다.


📝 요약 및 결론

이 논문은 다음과 같은 중요한 사실을 밝혀냈습니다.

  1. 인공지능도 인간의 시각 원리를 배웠다: 인공지능도 그림을 볼 때 "볼록한 것이 앞쪽"이라는 인간의 규칙 (게슈탈트 법칙) 을 스스로 터득하고 있습니다.
  2. 결정은 '누군가'가 내리는 게 아니라 '싸움'의 결과다: 처음엔 고민하다가, 아주 초반의 작은 신호가 쌓여서 마지막에 결정이 났습니다.
  3. 인공지능의 눈을 조작할 수 있다: 특정 부품 (L0H9) 하나만 조절하면, 인공지능이 보는 세계를 바꿀 수 있습니다. 이는 인공지능이 단순히 패턴을 외운 것이 아니라, 의사결정 과정이 구체적으로 존재한다는 증거입니다.

왜 중요할까요?
이 기술은 인공지능이 잘못된 판단을 할 때 (예: 의료 영상에서 중요한 병변을 '배경'으로 무시해버리는 경우), 그 원인을 찾아내고 수정할 수 있게 해줍니다. 즉, 인공지능의 시각적 판단을 우리가 더 정밀하게 제어할 수 있는 방법을 찾은 것입니다.