Predictive Coding Networks and Inference Learning: Tutorial and Survey

이 논문은 신경과학에서 영감을 받은 예측 부호화 네트워크 (PCN) 와 추론 학습 (IL) 에 대한 포괄적인 검토와 형식적 규정을 제공하며, 기존 역전파 방식의 한계를 넘어 생물학적 타당성과 효율성을 갖춘 차세대 머신러닝 프레임워크로서의 가능성을 제시합니다.

Björn van Zwol, Ro Jefferson, Egon L. van den Broek

게시일 Mon, 09 Ma
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

1. 기존 AI vs. 새로운 AI: "선생님의 일방적 지시" vs. "스스로 추측하고 수정하는 학생"

**기존 AI (역전파, Backpropagation)**는 마치 엄격한 선생님이 학생에게 정답을 알려주고, 틀린 부분을 일일이 지적해 주는 방식과 같습니다.

  • 학생이 문제를 풀고 (입력), 선생님이 정답을 비교합니다.
  • 틀린 부분이 있으면, 선생님은 "너는 여기서 10 점, 여기서 20 점 틀렸어"라고 뒤에서부터 앞으로 차근차근 가르쳐 줍니다.
  • 이 방식은 매우 강력하지만, 뇌가 실제로 작동하는 방식과는 다릅니다. 뇌는 정답을 미리 알지 못하는데도 학습을 하니까요.

**새로운 AI (예측 코딩 네트워크, PCN)**는 스스로 추측하고, 실수를 고쳐 나가는 학생과 같습니다.

  • 학생은 문제를 풀기 전에 "아마 이 답이겠지?"라고 예측을 합니다.
  • 실제 정답 (또는 다음 단계의 정보) 을 보고, "아, 내가 예상한 것과 달라! 이 차이를 '오류'라고 부르지!"라고 생각합니다.
  • 이 **오류 (예측과 실제의 차이)**가 뇌의 하위 층에서 상위 층으로 올라가며, 뇌는 "다음엔 이 오류가 없도록 내 추측을 고쳐야지"라고 학습합니다.
  • 핵심: 정답을 알려주는 게 아니라, **"내가 잘못 예측한 부분 (오류)"**을 통해 스스로 배웁니다.

2. 이 기술의 세 가지 멋진 특징

이 논문은 PCN 을 세 가지 다른 시선으로 바라봅니다.

① "모든 구조를 다 할 수 있는 만능 도구" (일반화된 ANN)

기존 AI 는 주로 '층 (Layer)'이라는 계단식 구조만 다뤘습니다. 하지만 PCN 은 아무 모양이나 가능한 구조를 다룰 수 있습니다.

  • 비유: 기존 AI 가 '직선으로만 달리는 기차'라면, PCN 은 미로 속을 자유롭게 돌아다니는 탐험가입니다. 계단식 구조뿐만 아니라, 뇌처럼 복잡하게 얽힌 네트워크도 학습할 수 있어 훨씬 유연합니다.

② "확률로 세상을 이해하는 통계학자" (확률적 잠재 변수 모델)

PCN 은 단순히 정답을 맞추는 게 아니라, **"이 데이터가 나올 확률은 얼마나 될까?"**를 계산합니다.

  • 비유: 기존 AI 가 "이 사진은 고양이야!"라고 딱 잘라 말한다면, PCN 은 "이 사진은 90% 확률로 고양이이고, 10% 는 강아지일 수도 있어"라고 불확실성을 고려하며 학습합니다. 이는 생성형 AI(새로운 그림을 그리는 AI) 를 만들 때 매우 유용합니다.

③ "생물학적으로 더 그럴듯한 학습법" (추론 학습, IL)

기존 방식은 컴퓨터가 순서대로 계산해야 해서 속도가 느릴 수 있습니다. 하지만 PCN 의 학습 방식인 **'추론 학습 (Inference Learning)'**은 모든 층이 동시에 (병렬로) 계산할 수 있습니다.

  • 비유: 기존 방식은 "1 번 층이 계산 끝나야 2 번 층이 시작해"라고 줄 서서 기다리는 방식이라면, PCN 은 모든 층이 동시에 "내 오류는 뭐지?"라고 외치며 한 번에 해결하는 방식입니다.
  • 장점: 컴퓨터 칩 (특히 뇌처럼 생긴 뉴로모픽 칩) 에서 이 방식은 훨씬 빠르고 에너지를 적게 쓸 수 있습니다.

3. 왜 이것이 중요할까요? (실제 효과)

  • 더 빠른 학습: 특히 '연속 학습' (새로운 것을 배우면서 이전 것을 잊지 않는 것) 이나 '온라인 학습' (데이터가 하나씩 들어올 때 바로 학습) 에서 기존 AI 보다 훨씬 잘 작동합니다.
  • 더 적은 데이터: 적은 데이터로도 잘 학습할 수 있어, 데이터를 많이 구하기 힘든 상황에서도 유용합니다.
  • 뇌와 더 가까움: 뇌가 실제로 어떻게 정보를 처리하는지 (예측을 하고 오류를 수정하는 방식) 를 더 잘 반영하므로, 앞으로 더 똑똑하고 인간 같은 AI 를 만드는 데 핵심이 될 것입니다.

4. 결론: 앞으로의 AI 는 어떻게 변할까?

이 논문은 **"AI 가 이제부터는 단순히 정답을 외우는 기계가 아니라, 예측을 하고 실수를 통해 스스로 성장하는 존재가 되어야 한다"**고 말합니다.

기존의 강력한 AI 기술 (역전파) 을 완전히 버리는 것이 아니라, 뇌의 방식을 모방한 예측 코딩 (PCN) 을 더하면 AI 는 더 유연하고, 효율적이며, 인간처럼 학습할 수 있게 될 것이라고 전망합니다.

한 줄 요약:

"기존 AI 는 선생님이 일일이 가르쳐 주는 방식이라면, 새로운 AI(예측 코딩) 는 스스로 추측하고 실수를 고치며 배우는 똑똑한 학생입니다. 이 방식은 더 빠르고, 에너지를 적게 쓰며, 뇌처럼 유연하게 작동할 수 있어 미래 AI 의 핵심 열쇠가 될 것입니다."