From Kepler to Newton: Inductive Biases Guide Learned World Models in Transformers

이 논문은 공간적 매끄러움, 안정성, 그리고 시간적 국소성이라는 세 가지 최소한의 귀납적 편향을 도입함으로써, 일반적인 트랜스포머가 단순한 곡선 적합기(curve-fitter)에서 뉴턴의 힘과 같은 근본적인 물리 법칙을 발견할 수 있는 에이전트로 진화할 수 있음을 입증하며, 이를 통해 높은 예측 정확도와 진정한 인과적 이해 사이의 간극을 메운다.

원저자: Ziming Liu, Sophia Sanborn, Surya Ganguli, Andreas Tolias

게시일 2026-02-09
📖 4 분 읽기☕ 가벼운 읽기

원저자: Ziming Liu, Sophia Sanborn, Surya Ganguli, Andreas Tolias

원본 논문은 CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/) 라이선스로 제공됩니다. 이것은 아래 논문에 대한 AI 생성 설명입니다. 저자가 작성하거나 승인한 것이 아닙니다. 기술적 정확성을 위해서는 원본 논문을 참조하세요. 전체 면책 조항 읽기

당신에게 아주 똑똑한 로봇 학생이 있다고 상상해 보세요. 당신은 이 로봇에게 행성들이 태양 주위를 어떻게 움직이는지 가르치고 싶습니다. 당신은 행성들이 지나온 경로가 담긴 방대한 역사책을 로봇에게 주고, 다음에는 어디에 있을지 추측해 보라고 요청합니다.

이 논문이 던지는 핵심 질문은 이것입니다: 이 로봇 학생은 단순히 경로를 암기하는 것일까요, 아니면 움직임을 일으키는 물리 법칙을 실제로 '이해'하고 있는 것일까요?

저자들은 이 로봇에게 특별한 "보조 바퀴"(그들은 이를 **귀납적 편향(inductive biases)**이라고 부릅니다)를 제공하지 않으면, 이 로봇은 천재적인 암기가는 될 수 있어도 형편없는 물리학자는 될 것이라는 사실을 발견했습니다. 로봇은 경로를 완벽하게 그려내지만, 왜 그렇게 움직이는지에 대해서는 전혀 알지 못합니다.

다음은 이 문제를 해결한 과정을 세 가지 간단한 레슨으로 나누어 설명한 이야기입니다.

문제점: 로봇은 "곡선 맞추기 기계"이지 "물리학자"가 아니다

로봇의 뇌를 거대한 도서관이라고 생각해 보세요.

  • 케플러 방식 (로봇이 자연스럽게 했던 행동): 로봇은 행정 여정의 마지막 1,000개 지점을 살펴봅니다. 그리고 말합니다. "아하! 패턴이 보여. 이건 타원형이야. 나는 그냥 이 타원을 계속 그릴 거야." 이것은 마치 어린이가 그림을 따라 그리는 것과 같습니다. 그림은 제대로 그리지만, 만약 당신이 "왜 타원형인가요?" 또는 "무엇이 그것을 끌어당기고 있나요?"라고 묻는다면, 로봇은 답할 수 없습니다. 로봇은 단지 그 모양을 알고 있을 뿐입니다.
  • 뉴턴 방식 (우리가 원하는 것): 우리는 로봇이 "태양이 중력으로 행성을 끌어당기고 있습니다. 행성의 현재 속도와 위치를 안다면, 저는 인력을 계산하여 다음 단계를 예측할 수 있습니다"라고 말하기를 원합니다. 이것은 단순한 결과가 아닌 '원인'을 이해하는 것입니다.

이 논문은 표준 AI 모델(트랜스포머)이 자연스럽게 "추적자"(케플러)가 되며 "계산기"(뉴턴)가 되는 데 실패한다는 것을 보여줍니다. 이를 해결하기 위해 저자들은 세 가지 구체적인 "보조 바퀴"를 추가했습니다.


레슨 1: "픽셀화된 지도" 문제 (공간적 매끄러움)

비유: 당신이 로봇에게 도시를 탐색하는 법을 가르치고 있다고 상상해 보세요.

  • 실수: 당신은 모든 길모퉁이가 완전히 다른 무작위 색상인 지도를 로봇에게 줍니다. "빨간색"은 1번가와 메인 스트리트의 모퉁이이고, "파란색"은 1번가와 2번가의 모퉁이입니다. 비록 이 모퉁이들이 바로 옆에 붙어 있음에도 불구하고, 로봇은 이들을 완전히 무관한 것으로 인식합니다. 로봇은 매번 "빨간색"과 "파란색" 사이의 관계를 처음부터 다시 배워야 합니다.
  • 수정: 저자들은 행성의 위치를 아주 작은 "빈(bin)"(픽クセル과 같은 단위)으로 나눌 때 공간의 자연스러운 매끄러움을 깨뜨린다는 것을 깨달았습니다.
  • 해결책: 그들은 "빈"의 크기를 키우거나(더 적은 색상 사용), 빈을 아예 사용하지 않고 로봇에게 정확한 좌표(GPS와 같은 방식)를 직접 제공했습니다. 이를 통해 로봇은 "지점 A"가 "지점 B" 바로 옆에 있다는 것을 볼 수 있게 되었고, 혼란스러운 무작위 코드 뭉치가 아닌 실제 공간의 정신적 지도를 구축할 수 있게 되었습니다.

레슨 2: "도미노 효과" 문제 (공간적 안정성)

비유: 옆 사람에게 숫자를 속삭이는 "전화기 게임(Telephone)"을 한다고 상상해 보세요.

  • 실수: 만약 첫 번째 사람이 "50.1"이라고 속삭였는데 두 번째 사람이 "50.2"로 들었다면, 세 번째 사람은 "50.5"로 들을 수 있고, 마지막 사람에게 도달했을 때 숫자는 "100"이 되어 있을 수 있습니다. 물리학에서 만약 로봇이 행성의 위치를 예측할 때 아주 작은 실수라도 한다면, 그 실수는 단계마다 점점 커져서 결국 행성이 심우주로 날아가 버리거나 태양에 충돌하게 만듭니다.
  • 수정: 저자들은 표준 AI 학습이 너무 "완벽하다"는 점을 깨달았습니다. 그것은 오직 완벽한 과거 데이터로부터만 학습합니다.
  • 해결책: 그들은 일부러 로봇의 학습 데이터에 "고장"을 내기 시작했습니다. 로봇이 읽고 있는 이력에 약간의 정적 노이즈(라디오의 잡음 같은 것)를 추가했습니다. 이를 통해 로봇이 작은 실수로부터 회복하는 법을 배우도록 강제했고, 오류가 쌓이지 않고 미래를 예측할 수 있을 만큼 견고하게 만들었습니다.

레슨 3: "긴 기억" vs "짧은 기억" 문제 (시간적 국소성)

비유: 이것이 가장 중요한 부분입니다.

  • 긴 기억 (케플러): 지난 한 시간 동안 일어난 모든 일을 기억하는 로봇을 상상해 보세요. 다음에 무슨 일이 일어날지 추측할 때, 로봇은 거대한 곡선을 그리기 위해 한 시간 전체의 이력을 살펴봅니다. 이는 롤러코스터 트랙 전체를 보고 다음 행방을 예측하는 것과 같습니다. 곡선은 잘 그리겠지만, 물리 법칙은 이해하지 못합니다.
  • 짧은 기억 (뉴턴): 이제, 오직 지난 2초 동안의 일만 기억할 수 있는 로것을 상상해 보세요. 이 로봇은 전체 트랙을 볼 수 없습니다. 로봇은 반드시 지금 이 순간 카트가 어디에 있는지, 그리고 얼마나 빠르게 움직이고 있는지를 보고 다음 행방을 알아내야만 합니다.
  • 해결책: 저자들은 로봇이 짧은 기억을 갖도록 강제했습니다. 그들은 로봇에게 "너는 오직 직전의 과거만 볼 수 있다"라고 명령했습니다.
  • 결과: 로봇은 더 이상 "전체적인 그림"인 곡선에 의존할 수 없었기 때문에, 게임의 "규칙"을 알아내야만 했습니다. 다음 단계를 예측하기 위해 지금 당장 행성에 작용하는 보이지 않는 "끌림(중력)"을 계산해야만 했습니다. 갑자기 로봇은 타원을 그리는 것을 멈추고 힘을 계산하기 시작했습니다. 로봇은 물리학자가 된 것입니다.

핵심 요약

이 논문은 AI의 뇌를 어떻게 설계하느냐가 AI가 무엇을 배우는지를 결정한다고 결론짓습니다.

  • 만약 모든 것을 보게 하고 픽셀화된 지도를 준다면, 그것은 곡선 맞추기 기계(케플러)가 됩니다. 예쁜 그림은 그리지만 우주를 이해하지는 못합니다.
  • 만약 매끄러운 지도를 주고, 실수를 처리하는 법을 가르치며, 짧은 기억을 갖도록 강제한다면, 그것은 물리학자(뉴턴)가 됩니다. 스스로 물리 법칙을 발견하게 됩니다.

저자들은 물리 법칙을 AI에게 직접 프로그래밍할 필요가 없음을 보여줍니다. 단지 적절한 "귀납적 편향"(적절한 학습 제약 조건)을 제공하기만 하면, AI는 스스로 법칙을 발견하게 됩니다.

연구 분야의 논문에 파묻히고 계신가요?

연구 키워드에 맞는 최신 논문의 일일 다이제스트를 받아보세요 — 기술 요약 포함, 당신의 언어로.

Digest 사용해 보기 →