Text-Trained LLMs Can Zero-Shot Extrapolate PDE Dynamics, Revealing a Three-Stage In-Context Learning Mechanism
본 논문은 미세 조정이나 자연어 프롬프트 없이도 텍스트로 훈련된 대규모 언어 모델이 이산화된 편미분 방정식 (PDE) 해의 시공간 동역학을 제로샷으로 외삽할 수 있으며, 이는 문맥 길이에 비례하는 예측 정확도 향상과 함께 구문 모방, 탐색적 고엔트로피 단계, 그리고 수치적으로 확고한 예측으로 이어지는 3 단계 인-컨텍스트 학습 메커니즘을 통해 이루어짐을 규명했습니다.