For MSTd, Autoencoding is all you need

⚕️

이것은 동료 심사를 거치지 않은 프리프린트의 AI 생성 설명입니다. 의학적 조언이 아닙니다. 이 내용을 바탕으로 건강 관련 결정을 내리지 마세요. 전체 면책 조항 읽기

Each language version is independently generated for its own context, not a direct translation.

우리의 뇌는 마치 훌륭한 요리사처럼, 눈으로 들어온 시각 정보 (재료) 를 처리해서 세상을 이해합니다. 이 연구는 "어떤 레시피(학습 목표) 를 따르면 요리사가 가장 자연스러운 요리를 할 수 있을까?"를 실험했습니다.

연구진은 두 가지 다른 레시피를 가진 AI 요리사들을 훈련시켰습니다.

**방식 A: "정답 맞추기" **(감시형)
- 상황: 요리사에게 "이 재료를 보고 내가 어디로 가고 있는지 정확히 말해!"라고 시키고 정답을 맞춥니다.
- 결과: AI 는 정답을 맞추는 데는 아주 능숙해졌지만, 뇌의 실제 신경 세포 (MSTd) 가 가진 특징을 흉내 내지는 못했습니다. 마치 시험 점수는 잘 받지만, 실제 요리 실력은 엉망인 요리사 같죠.
**방식 B: "복원하기" **(자동 인코더)
- 상황: 요리사에게 "눈에 들어온 움직임을 기억했다가, 다시 똑같이 그려내라"라고 시켰습니다. 정답을 맞출 필요 없이, 입력된 정보를 잘 재구성하는 데 집중하게 한 거죠.
- 결과: 놀랍게도 이 방식이 뇌의 실제 신경 세포와 가장 비슷하게 작동했습니다. 정답을 맞추는 것보다, 정보를 잘 '복원'하는 과정이 뇌의 원리를 더 잘 설명해 줍니다.

요리사에게 주는 재료의 상태도 중요했습니다.

**생선 **(원시 데이터) 눈으로 본 그대로의 복잡한 움직임을 줬을 때, AI 는 혼란스러워했습니다.
**다진 생선 **(MT 영역 신호) 뇌의 한 단계 앞선 부분 (MT 영역) 이 이미 가공해서 정리해 준 정보를 줬을 때, AI 요리사는 훨씬 더 훌륭하게 뇌와 비슷한 반응을 보였습니다.
- 비유: 마치 생선 통째로 주는 것보다, 손질해서 뼈를 발라낸 생선살을 주면 요리사가 더 맛있게 요리할 수 있는 것과 같습니다.

과거에는 뇌가 정보를 효율적으로 처리하기 위해 **불필요한 정보를 버리는 것 **(희소성, Sparsity)이 중요하다고 생각했습니다. 마치 다이어트 하듯 정보를 줄여야 한다고요.

실험 결과: AI 에게 일부러 정보를 적게 쓰게 하거나 (희소성 강제), 양이 양수만 쓰게 하는 등의 규칙을 추가해 보았지만, 오히려 뇌와 더 멀어졌습니다.
결론: 뇌는 정보를 '버리는' 것보다, 정보를 어떻게 '재구성'하느냐가 더 중요했습니다.

뇌는 '정답 맞추기'보다 '재구성'을 좋아한다:
우리가 세상을 이해하는 뇌의 dorsal stream(등쪽 경로, 움직임과 공간 인식 담당) 은, "무엇이 어디에 있는가?"를 정확히 맞추는 것 (ventral stream, 배쪽 경로) 보다, 시각 정보를 다시 만들어내는 과정을 통해 학습하는 것 같습니다.
깊은 신경망이 항상 좋은 건 아니다:
최근 AI 는 층을 깊게 쌓을수록 똑똑해지지만, 뇌의 MSTd 영역을 모방할 때는 얇고 간단한 구조가 오히려 더 자연스러웠습니다. 뇌는 복잡한 계산을 위해 깊게 쌓기보다, 효율적인 재구성을 위해 얕게 연결된 것일 수 있습니다.
진정한 지능은 '목표'에서 온다:
단순히 정답을 맞추는 것 (지도 학습) 이 아니라, 스스로 정보를 이해하고 복원하려는 노력 (비지도 학습) 이 뇌의 복잡한 움직임을 이해하는 핵심 열쇠일 수 있습니다.

"뇌가 움직임을 이해하는 비결은 '정답을 맞추는 것'이 아니라, '눈에 보이는 움직임을 다시 그려내는 것'에 있다. 그리고 그 과정은 이미 정리된 정보를 바탕으로 얇은 층에서 이루어질 때 가장 자연스럽다."

이 연구는 우리가 만든 인공지능이 단순히 정답을 맞추는 것을 넘어, 인간과 같은 방식으로 세상을 '이해'하려면 어떤 목표를 가져야 하는지 중요한 방향을 제시해 줍니다.

유사한 논문