Identifying and Evaluating Inactive Heads in Pretrained LLMs

この論文は、12 のスコア関数を評価し、モデル介入を通じて検証した結果、LLM のアテンションヘッドの平均 12% 以上が非活性であり、特定の文脈で除去しても性能を維持できること、また従来のアテンション重みに依存する手法では見逃される非活性ヘッドが存在することを明らかにしました。

Pedro Sandoval-Segura, Xijun Wang, Ashwinee Panda, Micah Goldblum, Ronen Basri, Tom Goldstein, David Jacobs

公開日 2026-03-03
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

🏢 巨大なオフィスと「働いていない社員」たち

AI の脳みそ(Transformer 構造)は、巨大なオフィスビルのようなものです。このビルには、**「アテンション・ヘッド(Attention Heads)」**と呼ばれる何百、何千もの「社員」がいます。

  • 社員(アテンション・ヘッド)の仕事: 入力された文章(質問や会話)のどの部分が重要かを見極め、必要な情報だけを集めて次のステップに渡すことです。
  • これまでの常識: 「すべての社員が一生懸命働いているはずだ」と考えられていました。

しかし、この論文の研究者たちは、**「実は、多くの社員が『ただ座っているだけ』で、ほとんど何もしていない(働いていない)」**ことに気づきました。

🔍 従来の「見分け方」の失敗

以前は、社員が働いているかどうかを見るために、**「誰に注目しているか(視線)」**だけを見ていました。

  • 従来の方法: 「最初の言葉(例:『こんにちは』)ばかりをじっと見つめている社員は、ただの『お飾り』だから働いていない」と判断していました。
  • 問題点: これだと、**「実は他の社員も働いていないのに、見逃してしまう」**というミスが多発していました。まるで、「会議で一番最初に話した人だけを見て、他の人が寝ていることに気づかない」ようなものです。

💡 新しい「見分け方」:結果(Output)を見る

この論文では、**「視線(誰を見てるか)」ではなく、「実際に手渡した結果(Output)」**を見て判断する新しい方法を提案しました。

  • 新しい方法: 「その社員が、他の人たちに**『何』を渡したか**」を見ます。
    • もし、その社員が渡すものが**「ほぼゼロ(無価値なもの)」であれば、たとえ一生懸命視線を動かしていても、「実は働いていない(Inactive Head)」**と判断します。
    • これを**「平均出力ノルム(Avg Head Output Norm)」**という指標で測ります。

🧪 実験:「働いていない社員」を解雇(ゼロにする)したらどうなる?

研究者たちは、この新しい方法で見つけた「働いていない社員」を、実際にモデルから**「ゼロ(無効化)」**にして、AI がテスト(MMLU という難問テスト)を解けるか試しました。

  • 結果:
    • 驚くべきことに、全体の約 12% 以上の社員を「解雇(無効化)」しても、AI のテストの正解率はほとんど変わりませんでした!(1% 以内の誤差で維持)。
    • 従来の方法(視線だけを見る)だと、見逃していた**「7% 以上の働いていない社員」**を、新しい方法で見つけることができました。

📊 重要な発見:3 つのポイント

  1. 「お飾り」はもっと多い:
    従来の方法では「働いていない社員」は 5% 程度だと思われていましたが、実際には12% 以上いました。つまり、AI はもっと無駄な計算をしている可能性があります。

  2. モデルの種類に関係ない:
    この「結果を見る方法」は、Llama、OLMo、Qwen など、異なる種類の AI モデル(家族)すべてで通用しました。どのモデルでも、**「出力が小さい=働いていない」**というルールが当てはまります。

  3. 学習(微調整)は変化しない:
    AI をさらに学習させて(Fine-tuning)、より賢くしても、「働いていない社員」の割合や行動はほとんど変わりませんでした。 逆に、AI が巨大になる(スケールアップ)と、初めて行動が変わる傾向が見られました。

🚀 この発見はどんな意味があるの?

  • 効率化のヒント: もし「働いていない社員」を特定できれば、AI が動く時にその部分をスキップしたり、メモリから削除したりすることで、AI をもっと速く、安く動かせる可能性があります。
  • AI の仕組みの理解: 「なぜ AI はそんなに大きいのに、実は半分も使ってないのか?」という謎に迫る第一歩になりました。

まとめ

この論文は、**「AI の頭の中を覗いて、実は『寝ている社員』が結構いることを発見し、それを『結果(Output)』という新しい基準で見分ける方法を見つけた」**というお話です。

これにより、私たちは AI をより賢く、効率的に使うための道筋が見えてきました。まるで、巨大なオフィスで「本当に働いている人」だけを残して、無駄なコストを削ぎ落とすようなものです。

このような論文をメールで受け取る

あなたの興味に合わせた毎日または毎週のダイジェスト。Gistまたは技術要約を、あなたの言語で。

Digest を試す →