原著者： Ziming Liu, Sophia Sanborn, Surya Ganguli, Andreas Tolias

公開日 2026-02-09

📖 1 分で読めます☕ さくっと読める

原著者： Ziming Liu, Sophia Sanborn, Surya Ganguli, Andreas Tolias

原論文は CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/) でライセンスされています。 ✨ これは以下の論文のAI生成解説です。著者が執筆または承認したものではありません。技術的な正確性については原論文を参照してください。免責事項の全文を読む

想像してみてください。あなたは、ものすごく賢いロボットの生徒を持っています。あなたは、惑星が太陽の周りをどのように動くかを、そのロボットに教えたいと考えています。あなたは、惑星がこれまでどこにいたかという膨大な歴史の記録をロボットに与え、次にどこへ行くかを予想するように頼みました。

この論文が投げかけている大きな問いは、**「このロボットの生徒は、単に通り道を暗記しているだけなのか、それとも動きを引き起こしている物理法則を本当に『理解』しているのか？」**ということです。

著者たちの発見によれば、特別な「補助輪」（彼らはこれを帰納バイアスと呼んでいます）を与えない限り、ロボットは天才的な暗記家にはなりますが、ひどい物理学者になってしまいます。ロボットは通り道を完璧に描くことはできますが、なぜ惑星がそのような動きをしているのかについては全く理解していません。単にその形を知っているだけなのです。

以下は、彼らがどのようにしてロボットを「修理」したのかを、3つのシンプルなレッスンに分けて説明した物語です。

問題点：ロボットは「曲線フィッター」であり、「物理学者」ではない

ロボットの脳を巨大な図書館だと考えてみてください。

ケプラー的アプローチ（ロボットが自然に行っていたこと）： ロボットは惑星の旅の直近1,000個の点を見ます。そして、「なるほど！パターンが見えたぞ。これは楕円形だ。このまま楕円を描き続けよう」と言います。それは、子供が絵をなぞっているようなものです。絵は正しく描けますが、「なぜそれが楕円なのか？」「どのような力がそれを引き寄せているのか？」と聞かれたら、ロボットには答えられません。ロボットはただ、その形を知っているだけなのです。
ニュートン的アプローチ（私たちが求めているもの）： 私たちは、ロボットに「太陽が重力で惑星を引き寄せている。現在の惑星の速度と位置を知っていれば、次のステップへの引力を計算できる」と言ってほしいのです。これは、単なる結果ではなく、原因を理解することです。

この論文は、標準的なAIモデル（Transformer）は自然と「なぞり描き屋」（ケプラー）になってしまい、「計算機」（ニュートン）になることに失敗することを示しています。これを修正するために、著者たちは3つの特定の「補助輪」を追加しました。

レッスン1：「ピクセル化された地図」の問題（空間的な滑らかさ）

比喩： あなたがロボットに街のナビゲーションを教えようとしていると想像してください。

間違い： あなたはロボットに、すべての街角が全く異なるランダムな色で塗られた地図を与えます。「赤」は1丁目とメイン通りの角。「青」は1丁目と2丁目の角。たとえこれらの角がすぐ隣り合っていたとしても、ロボットには全く無関係なものとして映ります。ロボットは、「赤」と「青」の関係を毎回ゼロから学び直さなければなりません。
修正： 著者たちは、惑星の位置を小さな「ビン（箱）」に分割したとき、空間の自然な滑らかさが壊れてしまうことに気づきました。
解決策： 彼らは「ビン」を大きくする（色の種類を減らす）、あるいはビンを使うのをやめて、正確な座標（GPSのようなもの）をそのまま与えるようにしました。これにより、ロボットは「地点A」が「地点B」のすぐ隣にあることを理解できるようになり、混乱したランダムなコードの塊ではなく、空間の真のメンタルマップを構築できるようになりました。

レッスン2：「ドミノ倒し」の問題（空間的な安定性）

比喩： 数字を隣の人にささやく「伝言ゲーム」をしているところを想像してください。

間違い： もし最初の人が「50.1」とささやき、二番目の人が「50.2」と聞き取り、三番目の人が「50.5」と聞き取ったとしたら、最後の方に到達する頃には数字は「100」になっているかもしれません。物理学において、もしロボットが惑星の位置を予測する際にわずかなミスを犯すと、そのミスはステップごとにどんどん大きくなり、最終的に惑星は深宇宙へと飛んでいくか、太陽に衝突してしまいます。
修正： 著者たちは、標準的なAIのトレーニングはあまりに「完璧すぎる」ことに気づきました。それは完璧な過去のデータからしか学習しません。
解決策： 彼らは、あえてロボットのトレーニングデータを「壊す」ことにしました。ロボットが読んでいる履歴に、少しのノイズ（ラジオの砂嵐のようなもの）を加えました。これにより、ロボットは小さなミスからどのように回復するかを学ぶことが強制され、エラーが積み重なって未来の予測が崩れないような、堅牢性を備えることができました。

レッスン3：「長い記憶」対「短い記憶」の問題（時間的な局所性）

これは最も重要な部分です。

長い記憶（ケプラー）： 過去1時間の出来事をすべて覚えているロボットを想像してください。次に何が起こるかを予想しようとする際、そのロボットは1時間の履歴全体を見て、巨大な曲線を描こうとします。それはジェットコースターのレール全体を見て、次の行き先を予想するようなものです。曲線を描くことはできますが、物理学は理解していません。
短い記憶（ニュートン）： 今度は、直前の2秒間しか記憶することを許されないロボットを想像してください。そのロボットはレール全体を見ることはできません。次にどこへ行くかを判断するために、「今まさに」カートがどこにあり、どのくらいの速さで動いているのかを見なければなりません。
解決策： 著者たちは、ロボットに短い記憶を持つよう強制しました。彼らはこう言いました。「直近の過去だけを見なさい」。
結果： ロボットはもはや「大きな絵としての曲線」に頼ることができなくなったため、ゲームのルールを解明せざるを得なくなりました。次のステップを予測するために、今まさに惑星に働いている目に見えない「引き（重力）」を計算しなければならなくなったのです。突然、ロボットは楕円を描くのをやめ、力を計算し始めました。ロボットは物理学者になったのです。

大きな教訓

この論文は、**「AIの脳をどのように設計するかによって、何が学習されるかが決まる」**と結論づけています。

もし、すべてを見せてピクセル化された地図を使わせれば、それは**「曲線フィッター」**（ケプラー）になります。きれいな絵を描きますが、宇宙の仕組みは理解していません。
もし、滑らかな地図を与え、ミスに対処する方法を教え、短い記憶を持つよう強制すれば、それは**「物理学者」**（ニュートン）になります。自ら重力の法則を発見するのです。

著者たちは、AIに物理法則をプログラムして教え込む必要はないことを示しています。ただ、適切な「帰納バイアス（適切なトレーニング上の制約）」を与えれば、AIは自ら法則を見つけ出すことができるのです。

技術要約：ケプラーからニュートンへ：誘導バイアスがTransformerにおける学習された世界モデルを導く

1. 問題提起

本論文は、汎用的な基盤モデル（Transformer）の能力における、科学的発見に関する決定的なギャップに対処している。従来の「AI物理学者」のアプローチは、記号的な物理法則の復元に成功してきたが、それらは物理学をあらかじめ「焼き込んだ」強力でドメイン固有の事前知識に依存することが多い。対照的に、Vafaら（2025）による最近の研究では、汎用的なTransformerは、たとえGPT-2規模であっても、「世界モデル」——すなわち、現象がなぜ起こるのかを説明する因果的な抽象化——を獲得できないことを示した。代わりに、これらのモデルは、基礎となる動力学的法則（ニュートン力学）を捉えることなく、幾何学的な曲線適合（ケプラー的なモデル）を通じて高い予測精度を達成してしまう。

中心となる研究課題は、**「なぜTransformerは惑星運動のニュートン的世界モデルを学習できないのか、そしてどのようにすればこれを修正できるのか？」**である。著者らは、この失敗はアーキテクチャの根本的な限界ではなく、特定の最小限の誘導バイアスの欠如に起因すると仮定している。

2. 手法

著者らは、制御された設定（中心質量周囲の2次元惑星運動の予測）において、Transformerの失敗モードを体系的に調査している。彼らは、幾何学的な予測と物理法則の発見との間の溝を埋めるために、3つの最小限の誘導バイアスを導入している。

問題の設定

タスクは、位置の履歴が与えられたときに、次の位置 $\vec{r}_{t+1}$ を予測することであり、これは自己回帰的な次トークン予測（NTP）問題として定式化される。

ベースライン: Vafaら（2025）の設定に従い、連続的な座標をトークン（ビン）に離散化し、クロスエントロピー損失を用いて予測を行う。
提案された修正: 著者らは、特定の誘導バイアスを分離するために、トークン化、損失関数、およびアテンションメカニズムのバリエーションをテストする。

3つの誘導バイアス

バイアス1：空間的滑らかさ（Spatial Smoothness）

失敗モード: デフォルトのトークン化は、連続的な空間座標を独立したビンへと離散化し、ランダムに初期化された埋め込みを使用する。これにより空間的な滑らかさが損なわれる。物理的に近い点であっても、異なるビンにある場合は無関係なものとして扱われる。著者らは、大規模なデータ（20Bトークン）を用いても、学習された埋め込み空間がコヒーレントな空間マップを形成できないこと（低い線形デコーダビリティ、 $R^2 \approx 0.86$ ）を示している。
解決策:
1. 最適化されたトークン化: 語彙サイズ（ $V$ ）を大幅に削減することで、空間マップの創発が改善される。著者らは、マップの品質を維持するためには、訓練データサイズ（ $D$ ）が語彙サイズ（ $V$ ）と同等以上の速さで増加しなければならないというスケーリング則を導出している（ $1-R^2 \propto D^{-\alpha_D} V^{\alpha_V}$ ）。
2. 連続座標: あるいは、離散化せずに連続座標を使用することで、本質的に空間的滑らかさを提供できるが、これは安定性の課題をもたらす。

バイアス2：空間的安定性（Spatial Stability）

失敗モード: 自己回帰モデルは誤差の累積に苦しみ、これは連続変数（回帰）を予測する場合、離散トークン（分類）と比較して悪化する。緩和策がない場合、小さな初期誤差が軌道の破綻（例：惑星が無限遠へ飛んでいく、あるいは太陽に突っ込む）を引き起こす。
解決策: ノイズを含むコンテキスト学習（Noisy Context Learning）。著者らは、訓練中に過去のコンテキストにガウスノイズを注入する。これにより、モデルは完璧な過去の状態に依存しない、ロバストな表現を学習することを強制される。
結果: ノイズを含むコンテキスト学習を用いることで、すべてのデータスケールにおいて、回帰（連続座標とMSE損失を使用）が分類（離散化された座標とクロスエントロピー損失を使用）を一貫して上回る。

バイアス3：時間的局所性（Temporal Locality）

失敗モード: 標準的なTransformerは長いコンテキスト長（例：1k+ トークン）を利用するため、軌道の全履歴にアクセスできる。これにより、モデルは過去のすべての点に基づいてグローバルな幾何学的形状（楕円）を適合させる「ケプラー的」なアプローチを促進してしまう。
解決策: 制限されたアテンション・ウィンドウ。著者らは、コンテキスト長を直近の過去（例：直近の2つの状態のみ）に制限する。これにより、未来の状態は局所的な状態（位置と速度）のみに依存するという物理的仮定が課される。これは、ニュートンの第2法則（2階微分方程式）と一致する。
結果: この制約により、モデルはグローバルな曲線適合を放棄し、代わりに軌道をステップごとにシミュレートするために、局所的な重力（ $\vec{F} \propto 1/r^2$ ）を推定することを学習する——これが「ニュートン的」なアプローチである。

3. 主な結果

空間マップの創発: トークン化されたモデルにおける学習された空間マップの質は、語彙サイズに非常に敏感である。大きな語彙（例： $V=7000$ ）は、コヒーレントなマップを学習するために非現実的な量のデータを必要とする。 $V$ を削減するか、連続座標を使用することで、この問題は解決される。
回帰 vs 分類: Vafaらの知見に反して、著者らは、ノイズを含むコンテキスト学習を用いて推論を安定させることができる限り、連続座標を用いた回帰が分類よりも優れていることを示している。
ケプラー的モデル vs ニュートン的モデル:
- 長いコンテキスト（ケプラー的）: モデルは、過去のすべての状態を用いてグローバルな楕円軌道を適合させる。予測は曲線を継続することによって行われる。
- 短いコンテキスト（ニュートン的）: 局所的な状態に制限されると、モデルは基礎となる力の法則を発見する。予測は微分方程式 $F=ma$ をシミュレートすることによって行われる。
誘導バイアスの階層: 本論文は、単純なアーキテクチャの選択（トークン化戦略、コンテキスト長）が、AIが「曲線適合器（ケプラー）」になるか「物理学者（ニュートン）」になるかを決定することを実証している。

4. 重要性と主張

本論文は、単純なアーキテクチャの選択こそが、汎用AIが物理法則を発見するか、単にデータを適合させるかに決定的な要因であると主張している。

ギャップの架け橋: 本研究は、「AI物理学者」モデル（強い事前知識を使用）と、汎用Transformer（物理学の学習に失敗する）との間の隔たりを埋めるものである。適切な（ドメインに依存しない）誘導バイアス（滑らかさ、安定性、局所性）を備えれば、汎用的なTransformerでも世界モデルを学習できることを示している。
自動化された科学的発見: これらの結果は、「AI科学者」というビジョンに対する「決定的なリトマス試験」として機能する。もし汎用的なアーキテクチャが、特定のエンジニアリングなしに古典力学の既知の法則を復元できないのであれば、未知の法則を発見することを信頼することはできない。
失敗のメカニズム: 本論文は、これまでの大規模モデルの失敗が容量の不足によるものではなく、幾何学的な相関よりも因果的な抽象化の創発を強制するために必要な、特定の誘導バイアス（特に時間的局所性と空間的安定性）の欠如によるものであることを明らかにしている。

著者らは、これらのバイアスを体系的に導入することで、Transformerは「次に何が起こるか」を予測することから、「なぜそれが起こるのか」を理解することへと移行でき、自動化された科学的発見への一歩を踏み出すことができると結論づけている。

From Kepler to Newton: Inductive Biases Guide Learned World Models in Transformers