The Discrete Charm of the MLP: Binary Routing of Continuous Signals in Transformer Feed-Forward Layers

이 논문은 트랜스포머의 MLP 계층이 연속 신호를 이진 라우팅하여 처리하며, 특히 GPT-2 Small 모델에서 후기 계층으로 갈수록 '기본 활성화' 뉴런과 '예외 처리' 뉴런 간의 합의 구조가 발달하여 비선형 처리가 필요한 토큰을 결정하는 메커니즘을 발견하고 이를 실험적으로 입증했다고 요약할 수 있습니다. **한 줄 요약:** 이 논문은 트랜스포머 모델의 MLP 계층이 연속적인 신호를 이진 라우팅 방식으로 처리하며, GPT-2 Small 의 후기 계층에서 '기본 활성화'와 '예외 처리' 뉴런 간의 합의 구조가 발달하여 비선형 처리가 필요한 토큰을 결정하는 메커니즘을 발견하고 이를 실험적으로 입증했다고 요약할 수 있습니다.

Peter Balogh

게시일 2026-03-12
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🏭 1. 핵심 비유: "공장"과 "수리공"

AI 의 내부에는 거대한 **공장 (MLP 레이어)**이 있습니다. 이 공장은 들어오는 모든 단어 (토큰) 를 처리합니다.

  • 기존의 생각 (부드러운 곡선): 공장 안에는 수천 명의 일꾼들이 모여서, 들어온 단어에 따라 아주 미세하게 수치를 조절하며 복잡한 곡선을 그리는 작업을 한다고 믿었습니다. 마치 유리를 연마하듯 부드럽게 다듬는다고요.
  • 이 논문의 발견 (이진 스위치): 실제로는 그렇지 않았습니다. 공장에는 **'자동 모드 (기본)'**와 **'수리 모드 (비상)'**라는 두 가지 스위치가 있었습니다.
    • 대부분의 경우 (자동 모드): 들어온 단어가 평범할 때는 (예: "the", "a" 같은 쉬운 단어), 공장은 거의 아무것도 하지 않습니다. 그냥 "그냥 지나가세요"라고 말하며 선형적으로 통과시킵니다.
    • 어려운 경우 (수리 모드): 문맥이 복잡하거나 의미가 모호할 때 (예: "그가"라는 단어가 누구를 가리키는지 헷갈릴 때), 공장 안의 **특수한 스위치 (N2123)**가 켜집니다. 이때 비로소 공장 전체가 가동되어 복잡한 수리 작업을 시작합니다.

🎛️ 2. 어떻게 작동할까요? "의사결정 위원회"

이 논문의 가장 재미있는 부분은 이 스위치가 어떻게 작동하는지 설명하는 **'합의 시스템 (Consensus System)'**입니다.

  • 7 명의 평의원 (Default-ON): 공장에는 평소에 켜져 있는 7 명의 '평의원' 같은 뉴런들이 있습니다. 이들은 보통 상황에서는 "문제없음 (OK)"이라고 신호를 보냅니다.
  • 비상 관리자 (Exception Handler): 그리고 N2123이라는 한 명의 '비상 관리자'가 있습니다. 이 사람은 평의원들이 모두 "OK"라고 할 때는 절대 입을 열지 않습니다.
  • 작동 원리:
    1. 평화로운 날: 7 명의 평의원이 모두 "OK"라고 동의하면, 비상 관리자는 잠자고 공장도 거의 작동하지 않습니다. (이때는 단순한 선형 처리로 충분합니다.)
    2. 혼란스러운 날: 만약 7 명 중 몇 명이 "아니오"라고 하거나 의견이 엇갈리면, 평의원들의 신호가 상쇄됩니다. 이때 **비상 관리자 (N2123)**가 깨어납니다. "여기서 뭔가 잘못됐구나! 복잡한 수리가 필요해!"라고 외치며 공장 전체를 가동시킵니다.

이것은 마치 법정과 같습니다. 배심원 7 명이 모두 유죄/무죄에 동의하면 판사는 바로 판결을 내립니다. 하지만 배심원들이 의견이 나뉘어 혼란스러우면, 판사 (비상 관리자) 가 나서서 복잡한 심리를 시작하는 것과 같습니다.

📊 3. 실험 결과: "수학 공식"은 실패했다

연구진은 "이 복잡한 공정이 수학적인 곡선 (다항식) 으로 설명될 수 있을까?"라고 물었습니다.

  • 결과: 전혀 아니었습니다. 수학적 곡선으로 설명하려니 실패했습니다.
  • 대신: 단어를 '0(간단함)'과 '1(복잡함)'으로만 분류하는 **이진법 (Binary)**으로 설명하면 정확도가 99% 이상으로 떨어지지 않았습니다.
  • 의미: AI 는 복잡한 수식을 계산하는 게 아니라, "이 단어는 단순해서 그냥 지나가도 돼 (0)" 아니면 **"이 단어는 복잡해서 자세히 봐야 해 (1)"**라고 결정하는 스위치를 켜고 끄고 있었습니다.

🚀 4. 왜 이것이 중요할까요?

이 발견은 AI 를 더 효율적으로 만드는 데 큰 도움이 됩니다.

  • 에너지 절약: 대부분의 단어는 '자동 모드'로 처리해도 됩니다. 복잡한 '수리 모드'를 켤 필요가 없는 것들입니다.
  • 속도 향상: AI 가 문장을 읽을 때, 모든 단어를 똑같이 정밀하게 분석할 필요가 없습니다. 스위치가 '자동'으로 켜진 단어는 빠르게 스킵하고, '비상'이 켜진 단어에만 집중하면 됩니다.
  • 이해의 진전: 우리는 AI 가 어떻게 '의미'를 이해하는지 더 잘 알게 되었습니다. AI 는 모든 것을 다 계산하는 게 아니라, 어떤 부분이 중요한지 (비상 상황인지) 판단하는 능력을 먼저 배운 것입니다.

💡 요약: "스마트한 스위치"

이 논문의 결론은 매우 간단합니다.

"인공지능은 부드러운 곡선을 그리는 화가가 아니라, 상황에 따라 '간단한 길'과 '복잡한 길'을 선택하는 현명한 안내자입니다. 그리고 그 선택은 0 과 1 의 명확한 스위치로 이루어집니다."

이처럼 AI 의 내부 작동 원리가 단순한 스위치처럼 명확하게 작동한다는 사실은, 우리가 AI 를 더 잘 이해하고 더 똑똑하게 만들 수 있는 새로운 길을 열어줍니다.