Causality \neq Invariance: Function and Concept Vectors in LLMs

大規模言語モデル(LLM)には入力形式に依存しない抽象的な概念表現が存在するが、それがコンテキスト学習の性能を直接駆動する「関数ベクトル」とは異なり、入力形式に頑健な「概念ベクトル」は注意ヘッドの異なるサブセットによって構成され、分布外での一般化において優位性を示すことが明らかになった。

Gustaw Opiełka, Hannes Rosenbusch, Claire E. Stevenson

公開日 2026-02-27
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

この論文は、最新の AI(大規模言語モデル)が「どうやって考えているのか」を解明しようとした、とても面白い研究です。

タイトルにある**「因果関係(Causality)≠ 不変性(Invariance)」という少し難しい言葉を使っていますが、実はとてもシンプルで、「AI の頭の中にある『仕事をする回路』と『本質を理解する回路』は、実は別物だった!」**という発見を伝えています。

これをわかりやすく説明するために、**「優秀な翻訳者」「抽象的な哲学者」**という 2 つのキャラクターを使って例えてみましょう。


1. 従来の考え方:「1 つの魔法の杖」

これまでの研究では、AI が新しいタスク(例えば「反対語を見つける」こと)を学習する時、AI の頭の中に**「そのタスクを完璧に実行するための魔法の杖(Function Vector:機能ベクトル)」**が 1 本だけ作られると考えられていました。
この杖があれば、どんな言葉や形式で質問されても、AI は同じように正解を出せるはずだ、と期待されていました。

2. この論文の発見:「2 つの異なる回路」

しかし、この研究チームは、AI の頭の中を詳しく調べて、**「実は 2 つの全く違う回路が働いている!」**と気づきました。

🔧 回路 A:「仕事をする回路(Function Vectors / FV)」

  • 役割: 即座に正解を出すための**「実務家」**です。
  • 特徴:
    • 得意なこと: 質問の形式が同じなら、ものすごく上手に仕事をします。例えば、「英語で選択肢付き(A/B/C)」で聞かれたら、その形式に完璧に合わせた答えを出します。
    • 弱点: 形式が変わると、その回路は**「壊れてしまう」か、「別のもの」**になってしまいます。
    • 例え: 「英語の選択肢形式」で訓練された実務家は、「フランス語の自由記述形式」で同じ質問をされると、パニックになって「えっ、何?この形式は違う!」と混乱してしまいます。
    • 結論: この回路は、「タスクそのもの」ではなく「タスク+形式(言語や見た目)」をセットで覚えているのです。

🧠 回路 B:「本質を理解する回路(Concept Vectors / CV)」

  • 役割: 質問の背後にある**「本質的な意味」を理解する「哲学者」**です。
  • 特徴:
    • 得意なこと: 質問の形式(英語かフランス語か、選択肢があるかないか)がどう変わっても、**「これは『反対語』を見つける問題だ!」**という本質を常に理解しています。
    • 弱点: 実務家(FV)ほど、即座に正解を導き出す力(影響力)は強くありません。
    • 例え: この哲学者は、「反対語」の本質を理解しているので、どんな言語や形式で聞かれても、「あ、これは『反対』の話ね」と冷静に判断できます。
    • 結論: この回路は、「形式を捨てて、概念そのもの」を抽象的に捉えています。

3. 驚きの事実:「同じ場所にいるのに、全く別の人」

さらに面白いのは、この 2 つの回路(実務家と哲学者)は、AI の頭の中の**「同じ階層(レイヤー)」に存在しているのに、「使っている部品(アテンションヘッド)」がほとんど重ならない**ということです。

  • **実務家(FV)**は、タスクを「実行」するために使われます。
  • **哲学者(CV)**は、タスクの「意味」を「理解」するために使われます。

つまり、AI は**「本質を理解している(哲学者がいる)」のに、「実際に答えを出すときは、その理解とは別の、形式に依存した回路(実務家)を使っている」**という、少し不思議な状態になっているのです。

4. なぜこれが重要なのか?(応用編)

この発見は、AI をより賢く制御する(Steering)ために重要です。

  • 同じ形式で使うなら: 「実務家(FV)」を使うのが一番効果的です。例えば、英語の選択肢形式で訓練した AI を、同じ形式で使うなら、FV を操作すれば劇的に性能が上がります。
  • 違う形式で使うなら(汎用性): 「哲学者(CV)」を使うべきです。もし「英語で教えたことを、フランス語や選択肢形式でも使いたい」という場合、FV だと失敗しますが、CV なら本質を理解しているので、うまく通用します。

まとめ:AI の「思考」の正体

この論文は、**「AI が抽象的な概念(反対語や因果関係など)を持っていることは確かだが、それが『正解を出すための動力』とは別物である」**と教えてくれました。

  • FV(機能ベクトル): 「形式に縛られた、その場限りの実務家」。
  • CV(概念ベクトル): 「形式を超えた、本質を理解する哲学者」。

私たちが AI をより賢く、汎用的に使うためには、この「実務家」と「哲学者」の両方を理解し、状況に合わせて使い分ける必要があるのかもしれません。

一言で言えば:

「AI は『反対語』という概念を本当に理解している(哲学者がいる)けれど、実際に答えを出すときは、その理解とは別の、形式に依存した『作業員(実務家)』が動いているんだ!」

これが、この論文が伝えたい「AI の頭の中の秘密」です。

このような論文をメールで受け取る

あなたの興味に合わせた毎日または毎週のダイジェスト。Gistまたは技術要約を、あなたの言語で。

Digest を試す →