LikePhys: Evaluating Intuitive Physics Understanding in Video Diffusion Models via Likelihood Preference

本論文は、動画生成モデルの直感的な物理理解を評価する新しいトレーニング不要な手法「LikePhys」を提案し、人間の嗜好と高い相関を持つ指標「PPE」を用いて、モデル容量や推論設定の拡大に伴う物理理解能力の向上傾向を実証的に明らかにしています。

Jianhao Yuan, Fabio Pizzati, Francesco Pinto, Lars Kunze, Ivan Laptev, Paul Newman, Philip Torr, Daniele De Martini

公開日 2026-03-09
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

「LikePhys」の解説:AI に「物理の直感」があるか、どうやって見抜く?

この論文は、「動画を作る AI(動画生成モデル)」が、本当に物理法則(重力や衝突、流体など)を理解しているのか、それともただ「それっぽく見せているだけ」なのかを、新しい方法でチェックする仕組みを紹介しています。

タイトルにある**「LikePhys」は、「物理的な直感(Intuitive Physics)」を「好み(Preference)」**で測る方法です。


🎬 1. 問題:AI は「物理」を本当に知っているのか?

最近の AI は、映画のような美しい動画を作れるようになりました。しかし、中身を見ると、**「ボールが壁に当たって跳ね返るはずなのに、すり抜けて消えてしまう」「水が上から下へ流れるはずなのに、逆さまに流れる」**といった、物理法則を無視した奇妙な動画を作ってしまうことがあります。

これまでの評価方法には、2 つの大きな問題がありました。

  1. 見た目だけで判断してしまう: 「映像が綺麗だから物理も正しい」と思い込んでしまう。
  2. 人間の主観に頼りすぎる: 「これ、おかしくない?」と人間が判断すると、人によって意見がバラバラになる。

🔍 2. 解決策:LikePhys(ライク・フィズ)の仕組み

この論文のアイデアは、**「AI が動画を作る過程そのもの」**に注目することです。

🧪 比喩:AI を「物理のテストを受ける学生」に見立てる

AI を「物理のテストを受ける学生」と想像してください。

  • 正解の動画(Valid): 重力に従ってボールが落ちる動画。
  • 不正解の動画(Invalid): 重力を無視してボールが浮遊する動画。
  • 重要: この 2 つの動画は、「見た目(色や形、背景)」は全く同じです。違うのは「物理法則に従っているか」だけ。

📝 評価方法:AI の「心の声(確率)」を聞く

通常、AI は動画を作る際、「この動画は自然な確率(尤度)が高いか?」を計算しています。

  • LikePhys の仮説: 「もし AI が物理を本当に理解していれば、『物理的に正しい動画』の方が、『物理的に間違っている動画』よりも、ずっと『自然(確率が高い)』と感じるはずだ

具体的な手順:

  1. AI に「物理的に正しい動画」と「物理的に間違っている動画(見た目は同じ)」のペアを見せる。
  2. AI が「この動画を作るのに、どれくらい苦労したか(ノイズを消すのに必要な計算量=損失)」を測る。
  3. 判定:
    • 「正しい動画」の方が計算が楽(損失が小さい)→ AI は物理を理解している!
    • 「間違っている動画」の方が計算が楽(損失が小さい)→ AI は物理を無視して、ただの模様として扱っている。

これを**「PPE(Plausibility Preference Error:妥当性選好誤差)」**と呼びます。この値が低いほど、AI の物理理解力が高いと判断します。


🏆 3. 実験結果:AI はどれくらい物理を理解している?

研究者は、12 種類のシナリオ(ボールの衝突、布の揺れ、水の流れる様子、影の動きなど)で 12 種類の最新 AI をテストしました。

📊 結果のまとめ

  • まだ不完全: 多くの AI は、複雑な動き(水の流れや、複数の物体がぶつかる様子)では、物理法則を無視してしまっています。
  • 進化の兆し: 大きなモデル(パラメータ数の多い AI)や、新しいアーキテクチャ(DiT など)を使うと、物理を理解する能力が向上している傾向があります。
  • 得意不得意:
    • 得意: 影の動きや、単純な物体の動き。
    • 苦手: 液体の動きや、複雑な衝突。

🤖 人間との比較

この「LikePhys」のスコアは、「人間が『これは物理的に正しい』と感じるかどうか」と非常に高い相関がありました。つまり、人間が「おかしいな」と感じる動画は、AI も「自然じゃない(確率が低い)」と感じているのです。


💡 4. なぜこれが重要なのか?

この研究は、単に「AI の評価」をするだけでなく、**「AI が世界をどう理解しているか」**を解明する第一歩です。

  • ロボットや自動運転への応用: 物理法則を理解していない AI は、現実世界でロボットを動かしたり、自動運転車を制御したりする際に、危険な判断を下す可能性があります。
  • よりリアルなシミュレーション: 物理法則を正しく理解した AI は、映画の VFX だけでなく、科学実験のシミュレーションや、新しい素材の開発にも役立つ「世界モデル」として機能するかもしれません。

🌟 まとめ

LikePhysは、AI に「物理のテスト」をさせるのではなく、**「AI が『自然な動画』と『不自然な動画』のどちらを『心地よい(確率が高い)』と感じるか」という、AI の「直感」**を測る方法です。

まるで、**「AI が物理法則を『暗記』しているのではなく、『体感』しているかどうか」**を見極めるような、とてもユニークで賢いアプローチです。これにより、私たちは AI が本当に「世界を理解」しているのか、それとも「ただの模倣」をしているのかを、より深く知るできるようになります。