Into the Rabbit Hull: From Task-Relevant Concepts in DINO to Minkowski Geometry

DINOv2 の SAE 解析を通じて、従来の線形表現仮説を補完し、トークンがアーキタイプ間の凸結合として構成される「ミンコフスキー表現仮説」を提唱し、視覚トランスフォーマーの概念空間における幾何学的・機能的構造を解明した。

Thomas Fel, Binxu Wang, Michael A. Lepori, Matthew Kowal, Andrew Lee, Randall Balestriero, Sonia Joseph, Ekdeep S. Lubana, Talia Konkle, Demba Ba, Martin Wattenberg

公開日 2026-03-02
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

この論文は、最新の AI 画像認識モデル「DINOv2」が、実は**「どうやって世界を見ているのか」**という驚くべき秘密を明かした研究です。

従来の考え方は「AI は、無数の小さな直線のベクトル(方向)を組み合わせて画像を理解している」というものでした。しかし、この論文は**「いや、AI はもっと立体的で、凸凹のある『箱』を組み合わせて世界を捉えているんだ」**と主張しています。

わかりやすくするために、3 つのステップで説明します。


ステップ 1:AI の「辞書」を作ってみた(32,000 個の概念)

まず、研究者たちは DINOv2 の頭の中を覗くために、巨大な**「概念の辞書」**を作りました。
これは、AI が画像を見たときに反応する「32,000 個の小さなパターン(概念)」のリストです。

  • 従来の考え方(線形仮説):
    AI は「猫」「犬」「赤」「青」といった概念を、それぞれ**「矢印(方向)」**として持っているとされていました。例えば、「猫」の矢印が強く指せば猫だと判断する、という単純な仕組みです。

  • 今回の発見:
    しかし、この辞書を使って AI の動きを詳しく見ると、単純な矢印だけでは説明できないことがわかりました。


ステップ 2:AI は「タスク」ごとに使い分けている

この辞書を使って、AI がどんな仕事(タスク)をするときに、どの概念を使っているかを見てみました。

  1. 分類(何の画像か判別する):
    **「『そこじゃない』を見つける探偵」**のような概念が見つかりました。

    • 例: 「ウサギ」の画像を分類する際、AI はウサギそのものだけでなく、「ウサギ以外の場所」(背景や空)を強く認識する概念も使っています。「ウサギはここにあるから、ここ(背景)はウサギじゃない」という否定の論理で正解を導いているのです。
  2. セグメンテーション(物体の輪郭をなぞる):
    **「境界線の探偵」**のような概念が見つかりました。

    • 物体の形そのものではなく、**「輪郭」や「端っこ」**にだけ反応する概念が、きれいに集まっていました。
  3. 距離の推定(奥行きを測る):
    **「影」「遠近法」「テクスチャの濃淡」**という、人間の脳が使うのと同じ 3 つの「手掛かり(キュー)」を、AI も独自に発見して使っていることがわかりました。


ステップ 3:新しい発見!「ラビットの穴」へ(ミンコフスキー幾何学)

ここからが論文の核心です。AI の内部構造は、単なる「矢印の集まり」ではなく、もっと複雑で面白い形をしていました。

🐇 アナロジー:「ウサギの穴」のイメージ

AI の思考空間は、広大な平らな地面ではなく、**「凸凹のある地形」「箱が積み重なった空間」**のようなものです。

  • 従来の考え方:
    概念は「北東方向」という矢印で表される。
  • 新しい考え方(ミンコフスキー幾何学):
    概念は、**「ウサギ」「茶色」「ふわふわ」といった「典型的な原型(アーキタイプ)」の周りにある「丸い領域(箱)」**で表されます。

AI は、ある画像を見たとき、**「これは『ウサギ』という箱のどこにいて、『茶色』という箱のどこにいて、『ふわふわ』という箱のどこにいるか」を計算して、それらを足し合わせ(Minkowski Sum)**て、最終的な答えを出しています。

なぜこれが重要なのか?

  • 矢印だと限界がある: 矢印を無限に伸ばすと、AI は「ありえない世界」を見てしまいます(例:「もっと猫っぽく!」と伸ばしすぎると、猫が溶けて消えてしまう)。
  • 箱(凸領域)だと自然: 「ウサギ」の箱の中なら、どんなに近づいても「ウサギ」です。AI はこの**「箱の境界」**の中で安全に思考しています。

🧩 多頭アテンションの仕組み

AI の「アテンション(注目)機構」は、元々「複数の選択肢を混ぜ合わせて、その平均(凸結合)」を出す仕組みです。
論文は、この仕組みが自然と**「複数の箱を足し合わせた空間」を作っていることを数学的に証明しました。つまり、AI は最初から「凸多面体(箱)」**の世界で生きているのです。


まとめ:何がすごいのか?

  1. AI は「否定」も理解している: 「ウサギじゃない場所」を見ることで「ウサギ」を見つけるなど、人間のような論理的な思考をしています。
  2. AI の世界は「箱」でできている: 概念は「方向」ではなく、「原型(アーキタイプ)の周りにある領域」です。
  3. これからの AI 解釈: これまで「AI の矢印を操作して制御しよう」としてきましたが、これからは**「AI の箱(領域)のどこに移動させるか」**を考える必要があります。

一言で言うと:
「AI は、無数の矢印で世界を指し示しているのではなく、『ウサギ』や『茶色』といった原型の周りにある『箱』を組み合わせて、立体的に世界を理解している」という新しい地図が見つかったのです。

この発見は、AI がなぜこれほど優秀なのか、そしてどうすればより安全に制御できるのかを理解する大きな一歩になります。