Equilibrium Propagation for Non-Conservative Systems

본 논문은 비가역적 상호작용을 고려하도록 학습 단계의 역학을 수정함으로써 임의의 비보존계(non-conservative systems)로 평형 전파(Equilibrium Propagation)를 확장하는 프레임워크를 제안하며, 이를 통해 비용 함수의 기울기를 정확하게 계산하고 이전 방법들보다 우수한 성능을 달성한다.

원저자: Antonino Emanuele Scurria, Dimitri Vanden Abeele, Bortolo Matteo Mognetti, Serge Massar

게시일 2026-06-02
📖 4 분 읽기🧠 심층 분석

원저자: Antonino Emanuele Scurria, Dimitri Vanden Abeele, Bortolo Matteo Mognetti, Serge Massar

원본 논문은 CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/) 라이선스로 제공됩니다. 이것은 아래 논문에 대한 AI 생성 설명입니다. 저자가 작성하거나 승인한 것이 아닙니다. 기술적 정확성을 위해서는 원본 논문을 참조하세요. 전체 면책 조항 읽기

개요: "역전파" 없이 기계 가르치기

당신이 로봇에게 사진 속의 고양이를 인식하도록 가르치려고 한다고 상상해 보세요. 오늘날 우리가 사용하는 표준적인 방식(이를 "역전파(Backpropagation)"라고 부릅니다)에서는, 로봇이 사진을 보고, 추측을 내놓은 뒤, 그것이 틀렸다는 것을 깨달으면, 자신의 실수를 바로잡기 위해 뇌의 모든 층을 거슬러 올라가며 전체적으로 "수정 신호"를 보냅니다.

문제는 이 "역전파(backward pass)" 과정이 실제 물리적인 기계(생물학적 뇌나 실리콘 칩 같은)에서는 구현하기 매우 어렵다는 점입니다. 왜냐하면 정보를 시간적으로 역행하거나 먼 거리를 즉각적으로 전달해야 하기 때문입니다.

**평형 전파(Equilibrium Propagation, EP)**는 더 똑똑하고 물리적인 학습 방식입니다. 역전파 대신, 로봇은 단순히 "안정된 상태(평형 상태)"로 이완됩니다. 로봇은 두 가지 약간 다른 시나리오를 시도합니다:

  1. 자유 상태(Free State): 로봇이 사진을 보고 자연스럽게 추측합니다.
  2. 넛지 상태(Nudged State): 누군가가 로봇의 최종 추측을 정답 쪽으로 살짝 밀어줍니다.

로봇이 이 두 가지 안정된 상태 사이에서 어떻게 변했는지를 비교함으로써, 다음번에 더 잘할 수 있도록 내부 설정을 어떻게 조정해야 하는지 알아낼 수 있습니다. 이는 마치 "내가 생각한 것"과 "내가 밀려난 곳" 사이의 차이를 느낌으로써 배우는 것과 같습니다.

문제점: "대칭성" 규칙

이 학습 방법의 원래 버전(EP)은 **대칭성(Symmetry)**이라는 엄격한 규칙을 따르는 시스템에서만 작동했습니다.

평형 상태를 유지하는 시스템을 매끄러운 언덕 위의 공이라고 생각해 보세요. 공이 A 지점에서 B 지점으로 구른다면, 그 경로는 언덕의 모양에 의해 결정됩니다. 경로를 반대로 돌려도 물리학적 법칙은 동일합니다. 컴퓨터 뇌에서도 이는 뉴런 A가 뉴런 B와 소통한다면, 뉴런 B도 뉴런 A와 정확히 같은 강도로 소통해야 함을 의미합니다.

하지만 현실 세계의 많은 시스템(그리고 현대의 AI 모델들)은 이런 매끄러운 언덕 같지 않습니다. 그것들은 조류가 흐르는 강이나 일방통행 도로와 같습니다.

  • 비보존 시스템(Non-Conservative Systems): 정보가 한 방향으로 흐릅니다 (데이터가 입력 → 은닉 → 출력으로 흐르지만, 결코 역방향으로는 흐르지 않는 피드포워드 네트워크처럼).
  • 문제점: 기존의 EP 방식은 이러한 시스템에서 작동하지 않습니다. 이 방식은 "강" 위에서 "언덕"의 수학을 적용하려 하기 때문에, 학습 계산이 틀려지게 됩니다. 로봇은 잘못된 교훈을 얻게 됩니다.

해결책: 두 가지 새로운 방법

저자들은 이 "평형 전파" 방식이 일방향적인 비대칭 시스템에서도 작동할 수 있도록 두 가지 새로운 방법을 제안합니다.

1. 비대칭 EP (AsymEP): "국소적 수정"

당신이 저울의 균형을 맞추려 하는데, 누군가 계속해서 한쪽 편에 몰래 무게를 추가하고 있다고 상상해 보세요. 기존 방식은 이를 무시하고 그냥 균형을 맞추려 하기 때문에 실패합니다.

AsymEP는 저울에 아주 작은 "카운터 웨이트(대항 무게)"를 추가합니다.

  • 작동 원 원리: "넛지" 단계(로봇이 정답 쪽으로 밀려지는 단계) 동안, 알고리즘은 특별한 수정 항을 추가합니다. 이 항은 연결이 얼마나 "불균형"하거나 "비대칭"인지를 바탕으로 계산됩니다.
  • 비유: 이것은 마치 타이어가 펑크 난 자전거를 타는 사이클리스트와 같습니다. 기존 방식은 그저 페달을 더 세게 밟으라고만 말합니다. AsymEP는 핸들에 작은 국소적 조정을 더해 펑크 난 타이어를 보완함으로써, 사이클리스트가 똑바로 주행하며 올바르게 배울 수 있게 해줍니다.
  • 결과: 이를 통해 연결이 일방향이더라도 시스템이 정확한 그래디언트(올바른 교훈)를 계산할 수 있게 합니다.

2. 다이아딕 EP (Dyadic EP): "두 개의 뇌" 접근법

AsymEP가 국소적인 수정이라면, Dyadic EP는 더 큰 구조적 변화입니다.

  • 비유: 당신에게 똑같이 생긴 두 개의 복사본이 나란히 실행되어야만 작동하는 복잡한 기계가 있다고 상상해 보세요. 한 복사본은 "순방향" 흐름을 나타내고, 다른 하나는 "역방향" 흐름을 나타냅니다.
  • 작동 원리: 알고리즘은 시스템의 변수를 두 배로 늘립니다. 이들은 서로 상호작용하는 새로운, 더 큰 "에너지 경관(energy landscape)"을 생성합니다. 이 확장된 공간 안에서, 원래 시스템의 복잡하고 일방적인 강물은 다시 매끄럽고 대칭적인 언덕으로 변모합니다.
  • 결과: 이제 이 "두 배가 된" 시스템에서 수학이 작동하기 때문에, 학습은 완벽해집니다. 이는 마치 거울을 사용하여 일방통행 도로를 양방향 도로처럼 보이게 만들어 표준 교통 규칙을 적용할 수 있게 하는 것과 같습니다.

실험 내용 (실험)

저자들은 단순히 수학적 계산만 한 것이 아니라, 실제 이미지 인식 작업(손으로 쓴 숫자나 옷 등을 식별하는 작업)을 통해 이 아이디어들을 테스트했습니다.

  1. 대칭 시작: 그들은 대칭적인 네트워크(기존 EP와 같은)에서 시작했습니다. AsymEP는 기존 방식보다 더 빠르게 학습하고 더 좋은 결과를 얻었습니다.
  2. 강제된 비대칭: 그들은 네트워크를 매우 "일방향적"(고도로 비대칭)으로 강제했습니다.
    • 기존 방식(Vector Field)은 처참하게 실패하여, 무작위 추측보다 나을 것이 없는 결과를 보였습니다.
    • AsymEP는 네트워크가 완전히 일방향이 되었을 때도 완벽하게 작동했습니다.
  3. 피드포워드 네트워크: 이것이 가장 큰 성과입니다. 현대의 AI(스마트폰에 들어있는 모델들 같은)는 보통 "피드포워드"(엄격한 일방향) 구조를 가집니다. 기존의 EP는 이러한 네트워크를 전혀 훈련할 수 없었습니다. 하지만 AsymEP는 이 네트워크들을 성공적으로 훈련시켜, 이것이 대부분의 현대 AI에서 사용되는 구조를 다룰 수 있음을 증명했습니다.
  4. 딥 러닝: 그들은 복잡한 데이터셋(CIFAR-10)과 딥 네트워크를 사용하여 테스트했습니다. AsymEP와 Dyadic EP는 표준적인 "역전파" 방식(현재의 골드 스탠다드)과 거의 동일한 성능을 보여주었습니다.

요약

  • 문제점: 멋진 "평형 전파" 학습 방식은 대칭적인 시스템에서만 작동했지만, 실제 AI와 물리적 시스템은 종종 비대칭적(일방향적)입니다.
  • 해결책: 저자들은 AsymEP(학습 규칙에 국소적 수정을 더함)와 Dyadic EP(수학적 작동을 위해 시스템 크기를 두 배로 늘림)를 만들었습니다.
  • 결과: 이 새로운 방법들은 이 물리적이고 뇌 친화적인 학습 스타일이 현대 AI에서 사용되는 유형의 네트워크에서도 작동할 수 있게 해주며, 표준적이고 구현하기 어려운 방식만큼이나 좋은 결과를 얻었습니다.

요약하자면, 그들은 기계의 내부 배선이 엄격하게 일방향일 때도 "이완"과 "국소적 넛지"를 사용하여 물리적 기계를 가르치는 방법을 찾아낸 것입니다.

연구 분야의 논문에 파묻히고 계신가요?

연구 키워드에 맞는 최신 논문의 일일 다이제스트를 받아보세요 — 기술 요약 포함, 당신의 언어로.

Digest 사용해 보기 →