원저자: Liu Ziyin, Yizhou Xu, Isaac Chuang

게시일 2026-02-04

📖 4 분 읽기☕ 가벼운 읽기

원저자: Liu Ziyin, Yizhou Xu, Isaac Chuang

원본 논문은 CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/) 라이선스로 제공됩니다. ⚕️ 이것은 동료 심사를 거치지 않은 프리프린트의 AI 생성 설명입니다. 의학적 조언이 아닙니다. 이 내용을 바탕으로 건강 관련 결정을 내리지 마세요. 전체 면책 조항 읽기

로봇에게 고양이를 인식하는 법을 가르친다고 상상해 보세요. 당신은 로봇에게 수천 장의 사진을 보여주고, 로봇은 더 잘 인식하기 위해 내부의 '노브(knobs, 매개변수)'를 조절합니다. 보통 우리는 로봇이 단순히 실수를 최소화하는 단 하나의 최적의 설정, 즉 골짜기의 가장 낮은 지점을 찾으려고 노력한다고 생각합니다.

하지만 이 논문은 로봇이 단순히 골짜기 바닥을 찾는 것이 아니라고 주장합니다. 로봇은 노이즈가 섞인 단계적인 방식(마치 어둠 속에서 무작위로 발걸음을 옮기는 것과 같은 방식)으로 학습하기 때문에, **엔트로피 힘(entropic force)**이라는 보이지 않는 "바람"에 의해 밀려나게 됩니다.

다음은 이 논문의 아이디어들을 쉬운 비유를 통해 정리한 내용입니다.

1. 보이지 않는 바람 (엔트로피 힘)

로봇의 학습 과정을 산맥에서 가장 낮은 지점을 찾으려는 등산가에 비유해 봅시다.

기존의 관례: 등산가는 오직 경사가 가장 가파른 곳을 따라 아래로 내려가는 중력(오차 최소화)만을 신경 씁니다.
새로운 관점: 등산가는 또한 강한 바람의 영향을 받습니다. 이 바람은 등산가가 무작위로 발걸음을 옮기고 전체 지도를 한꺼번에 보지 못한다는 사실(확률적 특성)에서 비롯됩니다.
결과: 이 "바람"(엔트로피 힘)은 등산가를 좁고 울퉁불퉁한 봉우리에서 멀어지게 하여, 넓고 평평한 고원으로 밀어냅니다. 등산가가 평평한 곳을 원해서가 아니라, 바람 때문에 좁고 날카로운 가장자리에는 머무를 수 없게 되는 것입니다.

2. 대칭성의 파괴

신경망에는 많은 "대칭성"이 존재합니다. 두 개의 똑같은 조각을 서로 바꿔 끼워도 그림이 똑같이 보이는 퍼즐을 상상해 보세요. 수학적으로는 동일한 결과를 내는 노브의 설정 방법이 무한히 많습니다.

논문의 주장: "바람"(엔트로피 힘)은 이러한 대칭성을 깨뜨립니다. 이 힘은 로봇이 무한한 가능성 중 오직 하나의 특정 배치만을 선택하도록 강제합니다.
비유: 회전하는 팽이를 상상해 보세요. 팽이는 어느 방향으로든 돌 수 있습니다(대칭성). 하지만 약간 울퉁불퉁한 탁자 위에 팽이를 놓으면(엔트로피 힘), 팽이는 결국 흔들리다가 특정한 방향으로 자리를 잡게 됩니다. 학습 과정의 노이즈는 네트워크가 무한한 가능성을 하나의 안정적인 솔루션으로 좁혀서 "선택"하게 만듭니다.

3. 노력의 "등분배" (Equipartition of Effort)

물리학에는 시스템이 평형 상태에 있을 때 에너지가 고르게 분산된다는 "에너지 등분배 법칙"이라는 규칙이 있습니다.

논문의 발견: 로봇도 이와 유사한 동작을 수행합니다. 로봇은 모든 층(layer)에 걸쳐 "노력"(그래디언트)을 자동으로 균형 있게 배분합니다.
비유: 보트에 탄 노잡이 팀을 상상해 보세요. 만약 한 명의 노잡이가 너무 세게 젓고 다른 이들이 너무 약하게 저으면, 배는 제자리에서 뱅글뱅글 돌게 됩니다. 엔트로피 힘은 마치 코치처럼 작용하여 모든 노잡이가 정확히 같은 양의 힘으로 젓도록 강제합니다. 논문은 로봇이 특정 층이 모든 일을 다 하고 다른 층은 아무것도 하지 않는 것이 아니라, 모두가 "부하를 공평하게 나누어 가지도록" 스스로를 조직한다는 것을 증명합니다.

4. 왜 서로 다른 로봇들이 비슷하게 생각하는가 (보편적 표현)

당신은 서로 다른 두 로봇을 같은 작업으로 훈련시킨다면, 그들이 시작할 때의 무작위 설정이 다르기 때문에 서로 다른 내부적 "생각"(표현)을 발전시킬 것이라고 생각할 수도 있습니다.

논문의 주장: 엔트로피 바람 때문에, 그들은 실제로 거의 똑같은 방식으로 생각하게 됩니다.
비유: 서로 다른 두 그룹의 사람들이 미로를 통과하려고 한다고 상상해 보세요. 설령 시작 지점이 다르더라도, 미로의 규칙(게임의 규칙)이라는 "바람"이 그들을 모두 동일한 특정 경로로 밀어 넣습니다. 이 논문은 이 "바람"이 서로 다른 AI 모델들이 어떻게 시작했느냐에 관계없이 그들의 내부 지도를 완벽하게 일치시키도록 강제한다는 것을 증명합니다. 이것을 "플라토닉 표현 가설(Platonic Representation Hypothesis)"이라고 합니다. 즉, 데이터를 이해하는 하나의 "완벽한" 방법이 존재하며, 학습 과정이 자연스럽게 그것을 찾아낸다는 것입니다.

5. 날카로움의 역설 (왜 로봇은 불안해하는가)

AI 분야에는 논쟁이 있습니다. 로봇이 "평탄한" 솔루션(안전하고 안정적임)을 선호할까요, 아니면 "날카로운" 솔루션(정밀하지만 위험함)을 선호할까요?

논문의 설명: 그것은 데이터에 달려 있습니다.
비유: 데이터가 불균형하고 지저잡스럽다면(예를 들어, 어떤 단어는 하루에 1,000번 쓰이고 어떤 단어는 일 년에 한 번 쓰이는 언어를 배우는 경우), "바람"은 로봇을 "날카로운" 구석으로 밀어 넣습니다. 이는 마치 로봇이 주변 지형이 너무 불안정해서 좁은 절벽 끝에 서 있을 수밖에 없는 상황과 같습니다. 하지만 데이터가 균형 잡혀 있다면, 바람은 로봇을 다시 넓고 평평한 고원으로 밀어냅니다. 로봇이 선택하는 것이 아니라, 데이터의 불균형이 로봇을 날카로운 지점으로 몰아넣는 것입니다.

요약

이 논문은 딥러닝의 "마법"이 단순히 오차를 최소화하는 것만이 아니라고 제안합니다. 그것은 최적화(정답을 맞히려는 노력)와 엔트로피(학습 과정의 노이즈와 무작위성) 사이의 물리적인 춤과 같습니다.

이 "엔트로피 힘"은 마치 조각가처럼 작용합니다. 로봇이 어떻게 만들어질 수 있는지에 대한 무한한 가능성을 깨뜨리고, 이를 특정한, 균형 잡힌, 그리고 보편적으로 정렬된 형태로 만들어냅니다. 이것이 왜 서로 다른 AI 모델들이 놀라울 정도로 유사한 방식으로 생각하게 되는지, 그리고 왜 우리가 명령하지 않아도 왜 그들이 자연스럽게 내부적인 노력을 균형 있게 배분하는지를 설명해 줍니다.

기술 요약: 신경 열역학: 딥러닝 및 보편적 표현 학습에서의 엔트로피 힘

문제 정의

SGD(Stochastic Gradient Descent) 및 그 변형들로 학습되는 현대 신경망은 능력의 출현(emergence of capabilities), 손실 지형(loss landscape)의 점진적인 날카로워짐과 평탄해짐, 상전이와 유사한 역학, 그리고 서로 다른 모델 간의 보편적 표현 정렬(universal representational alignment)과 같은 복잡한 창발적 행동을 보입니다. 이러한 현상들은 단순한 손실 최소화(loss minimization)의 관점으로는 설명하기 어렵습니다. 이러한 행동들은 유한한 온도의 물리계와 유사하지만, 이를 구동하는 정밀한 수학적 본질(흔히 "암묵적 편향(implicit bias)"이라 불리는)은 여전히 규명되지 않은 상태로 남아 있습니다. 기존 이론들은 정체성(stationarity) 특성이나 수정된 손실 함수에 의존하는 경우가 많으나, 이러한 역학을 대칭성 깨짐(symmetry breaking) 및 보편적 구조의 출현과 완전히 연결하는 데는 실패했습니다.

방법론

저자들은 신경망의 학습 역학을 모델링하기 위해 엄격한 **엔트로피 힘 이론(entropic-force theory)**을 제안합니다. 핵심 방법론은 다음과 같습니다:

엔트로피 손실 함수의 유도:
매개변수 대칭성 이론을 바탕으로, 저자들은 유효한 "엔트로피 손실" $\phi_\eta$ (및 그 기대값 $F_{\eta, \gamma}$ )를 정의합니다. 이 손실 함수는 학습률 $\eta$ 를 가진 이산 시간 확률적 역학인 SGD를 근사하도록 설계되었습니다.
엔트로피 손실은 다음과 같이 공식화됩니다:
$F_{\eta, \gamma}(\theta) = \mathbb{E}_x[\ell(x,\theta)] + \gamma\|\theta\|^2 + \frac{1}{4}\mathbb{E}_B\|\sqrt{\Lambda}\mathbb{E}_{x\in B}\nabla\ell(x,\theta)\|^2 + O(\|\Lambda\|^2)$
여기서 세 번째 항은 이산화 오차(discretization error)와 그래디언트 노이즈로부터 발생하는 유효 엔트로피( $S(\theta)$ )를 나타냅니다. 이 엔트로피 항의 그래디언트 $\nabla S$ 가 바로 **엔트로피 힘(entropic force)**으로 정의됩니다.
대칭성 분석:
논문은 이러한 엔트로피 힘이 손실 지형 내의 매개 변수 대칭성과 어떻게 상호작作用하는지 분석합니다. 저자들은 $K$ -불변성(연속 대칭성)을 정의하고, 엔트로피 항이 전체 유효 손실의 불변성을 어떻게 수정하는지 조사합니다.
이론적 증명:
저자들은 엔트로피 힘이 연속적인 매개 변수 대칭성은 체계적으로 깨뜨리면서도 이산적인 대칭성은 보존한다는 일련의 정리들을 증명합니다. 이는 "그래디언트 균형(gradient balance)" 현상을 초래하며, 이는 통계 물리학의 에너지 등분배 법칙(equipartition theorem)과 유사합니다.
실험적 검증:
이 이론은 다양한 아키텍처(ResNet18, ReLU 네트워크, Deep Linear Networks, Self-Attention 레이어, Vision Transformer)와 데이터셋(CIFAR-10, MNIST, ImageNet)을 통해 검증되었습니다. 주요 지표로는 그래디언트 공분산 균형, 표현 정렬(CKA), 손실 지형의 날카로움 등이 사용되었습니다.

주요 기여

1. 엔트로피 손실과 대칭성 깨짐

본 논문은 엔트로피 손실 항이 거의 모든 연속적인 매개 변수 대칭성(특히 비콤팩트 리 군(non-compact Lie group) 대칭성)을 깨뜨리는 반면, 이산 대칭성은 보존한다는 것을 확립합니다.

정리 2 & 3: 엔트로피 손실 하에서의 강건한 불변성은 노름 보존 변환(norm-preserving transformations)을 요구하며, 이는 초기화에 의존적인 솔루션으로 이어질 수 있는 연속 대칭성을 효과적으로 제거함을 증명합니다.

2. 그래디언트 균형 및 등분배 정리

대칭성의 파괴는 일련의 "마스터 균형 정리(Master Balance Theorems)"를 낳습니다. 이 정리들은 국소 최솟값(local minima)에서 서로 다른 레이어나 뉴런 간의 그래디언트 변동(2차 모멘트)이 반드시 균형을 이루어야 함을 예측합니다.

정리 5 (레이어 균형): ReLU 네트워크에서, 가중치 감쇠(weight decay)가 0일 때 레이어 간 그래디언트 공분산 행렬의 트레이스(trace)는 균형을 이룹니다 ( $\mathbb{E}\text{Tr}[g_i g_i^\top] = \mathbb{E}\text{Tr}[g_j g_j^\top]$ ).
정리 6 (뉴런 균형): 개별 뉴런에 대해서도 유사한 균형이 성립합니다.
정리 7 (그래디디언트 정렬): 행렬 인수 분해 및 셀프 어텐션 레이어(여기서 $\ell(x, W, U) = \ell(x, WU)$ )의 경우, $W$ 와 $U$ 의 그래디언트 공분산은 정렬됩니다.
이 결과들은 엔트로피가 네트워크의 매개 변수 전체에 고르게 퍼지는 비평형 학습 역학에 대한 **등분배 법칙(Equipartition Theorem)**의 확장으로 해석됩니다.

3. 플라톤적 표현 가설(Platonic Representation Hypothesis, PRH)의 증명

저자들은 서로 다른 모델이 유사한 데이터로 학습될 때 보편적인 표현으로 수렴한다는 플라톤적 표현 가설에 대한 이론적 증명을 제공합니다.

정리 8: 딥 리니어 네트워크(및 선형적으로 근사 가능한 비선형 네트워크)에 대해, 엔트로피 손실의 전역 최솟값은 초기화나 데이터 뷰 변환( $M_1, M_2, M_3$ 로 표현됨)에 관계없이 독립적으로 학습된 두 네트워크 간의 완벽한 정렬을 이끌어냅니다.
메커니즘: 엔트로피 힘은 시스템을 초기 조건에 대한 정보를 삭제하고 보편성을 생성하는 유일한 솔루션으로 몰아넣습니다.
대조: 논문은 가중치 감쇠가 지배적이거나 학습률 $\eta \to 0$ 인 경우, 시스템이 그래디언트 균형 대신 가중치 균형을 선호하게 되어 이러한 보편적 정렬이 깨진다는 것을 보여줍니다(정리 9).

4. 날카로움의 역설(Sharpness Paradox) 해결

본 논문은 SGD가 "평탄한(flat)" 최솟값(일반화)을 찾는 것과, 학습이 종종 "날카로운(sharp)" 최솟값으로 이어지는 "안정성의 경계(Edge of Stability, EOS)" 현상 사이의 명백한 모순을 다룹니다.

정리 10: 솔루션의 날카로움은 입력 특징(feature)과 라벨 노이즈의 균형에 의해 결정됩니다. 노이즈 스펙트럼이 불균형할 경우(예: 언어 모델의 토큰 무작위성 차이), SGD는 임의로 날카로운 솔루션으로 수렴합니다.
종합: 엔트로피 힘과 대칭성 깨짐은 모델이 날카로운 솔루션 또는 평탄한 솔루션으로 수렴할지를 결정하는 주요 결정 요인입니다. 점진적인 날카로워짐과 보편적 정렬은 동일한 근저의 엔트로피 메커니즘에 의해 구동되는 동전의 양면임이 밝혀졌습니다.

결과

대칭성 깨짐: 실험은 학습 과정에서 연속 대칭성은 깨지는 반면, 이산 대칭성은 지속됨을 확인합니다.
그래디언트 균형: ReLU 및 선형 네트워크에서 그래디언트 공분산 트레이스는 평등하게 수렴하며, 이는 손실의 감소보다는 엔트로피의 감소와 강한 상관관계를 보입니다.
보편적 정렬: 독립적으로 학습된 두 네트워크(서로 다른 아키텍처나 데이터 변환을 사용하더라도)는 은닉 표현 간에 거의 완벽한 정렬을 보입니다. 이 정렬은 입력 변환에는 강건하지만, 가중치 감쇠가 클 때는 사라집니다.
날카로움 역학: 이론적 예측은 라벨 노이즈가 불균형할 때 더 날카로운 솔루션을, 균형 잡힌 노이즈가 더 평탄한 솔루션을 만든다는 실험적 관찰과 일치합니다. "안정성의 경계" 경계는 특징과 라벨의 불확실성에 기반하여 이론에 의해 예측됩니다.

의의 및 주장

본 논문은 딥러닝의 열역학에 필적하는 원리적인 프레임워크를 구축했다고 주장합니다. 그 의의는 다음과 같습니다:

통합: 엔트로피 힘과 대칭성 깨짐이라는 단일 형식론 아래서 이질적인 현상들(보편적 정렬, 그래디언트 균형, 날카로움/평탄화 역학)을 통합합니다.
메커니즘 식별: 학습 역학에서의 **가역성 결여(irreversibility)**를 보편적 표현 학습을 가능하게 하는 핵심 메커니즘으로 식별하여, 플라톤적 표현 가설에 대한 물리적 설명을 제공합니다.
예측력: 하이퍼파라미터(학습률, 가중치 감쇠)와 데이터의 특성(노이즈 균형)이 학습된 솔루션의 기하학적 구조에 어떻게 영향을 미치는지에 대한 예측력을 제공합니다.
기초적 통찰: 단순한 손실 최소화를 넘어, 최적화와 엔트로피 모두에 의해 형성되는 "엔트로피 손실 지형"이 창발적 현상을 이해하는 데 기초가 됨을 시사합니다.

저자들은 현재 이론이 명시적인 대칭성을 가진 문제에 집중되어 있다는 한계를 언급하며, 향후 근사적 대칭성 및 더 복잡한 비평형 학습 절차로 결과를 확장하는 연구가 필요하다고 밝혔습니다.

Neural Thermodynamics: Entropic Forces in Deep and Universal Representation Learning