The Rise and Fall of GG in AGI

この論文は、心理測定学の「一般知能(g 因子)」の概念を大規模言語モデルのベンチマーク評価に適用し、2019 年から 2025 年にかけてのモデル進化において一貫した正の相関(一般知能)が観察される一方で、2024 年以降の推論特化モデルやツールの登場によりその説明力が低下し、汎用性の背後で専門化が進んでいることを示唆しています。

David C. Krakauer

公開日 2026-04-14
📖 1 分で読めます☕ さくっと読める
⚕️

これは査読を受けていないプレプリントのAI生成解説です。医学的助言ではありません。この内容に基づいて健康上の判断をしないでください。 免責事項の全文を読む

Each language version is independently generated for its own context, not a direct translation.

この論文は、人工知能(AI)の「知能」がどのように変化してきたか、そして「何でもできる万能な AI(AGI)」という概念が実は少し違う形に進化していることを、心理テストの統計手法を使って分析した興味深い研究です。

著者のデイビッド・クラカワー氏は、**「AI の知能を測るテストの結果を、人間の知能テスト(IQ テスト)の分析と同じ方法で見てみよう」**と考えました。

以下に、専門用語を排し、身近な例え話を使ってこの論文の核心を解説します。


1. 導入:AI も「IQ テスト」を受ける?

人間が IQ テストを受ける時、言語のテスト、数学のテスト、図形パズルなど、さまざまな分野のテストを受けます。
昔から心理学では、**「数学が得意な人は、言語も得意な傾向がある」という現象(これを「正の相関」と呼びます)が知られています。これを説明するために、「g 因子(一般知能)」**という、すべての能力の根底にある「共通のエンジン」のようなものが存在すると言われています。

この論文は、**「AI モデルも同じように、さまざまなテスト(ベンチマーク)を受けさせて、その結果を分析したらどうなるか?」**を調べました。
対象は、2019 年から 2025 年にかけて登場した 39 種類の AI モデルと、14 種類のテストです。

2. 発見その 1:AI には「万能な知能」があった(そして、それは消えつつある)

🌟 最初の頃:「何でもできる巨人」の時代

2023 年頃までの AI モデル(GPT-4 など)を分析すると、驚くべき結果が出ました。
「数学が得意な AI は、プログラミングも得意で、一般教養も高い」という**「完璧な正の相関」が確認されたのです。
これは、AI の世界に
「g 因子(万能の知能)」**が強く存在することを意味します。

  • 比喩: この頃の AI は、**「何でも屋の巨人」**でした。どんな分野のテストでも、巨人の「背の高さ(性能)」が高ければ、すべてのテストで高得点を取れました。
  • 統計: この時期、AI の能力の 90% 以上は、この「背の高さ(g 因子)」だけで説明できていました。

📉 最近の変化:「巨人」から「専門家集団」へ

しかし、2024 年後半になると、状況が変わり始めました。
新しい AI モデル(o1 や DeepSeek R1 など)が登場し、**「推論(考える力)」に特化したモデルが現れました。
すると、
「万能な知能(g 因子)の説明力は 90% から 77% へと低下」**しました。

  • 何が起きた?
    AI は「何でもできる巨人」から、「考えるのが得意な専門家」と「コードを書くのが得意な専門家」に分かれてきたのです。
    以前は「背が高ければ全部得意」でしたが、今は「背が高くても、得意分野によって得意・不得意がハッキリしてきた」状態です。

3. 発見その 2:AI は「道具」を使うことで知能を変えた

この変化の最大の理由は、**「道具(ツール)を使うようになったこと」**です。

  • 昔の AI: 頭の中だけですべてを計算し、記憶から答えを引っ張っていました。
  • 今の AI: 計算機を使ったり、検索エンジンを使ったり、コードを実行したりする「道具」を駆使して問題を解きます。

🧠 面白い比喩:
人間が「紙とペン」や「電卓」を使わないで計算テストを受けると、頭脳だけの能力が測れます。でも、実際には私たちは電卓やインターネットを使って頭脳を拡張しています。
今の AI は、**「道具を使うことで、自分自身の能力を拡張している」のです。
著者は、
「AI の知能は、AI 単体の能力ではなく、『AI + 道具』というセットの能力」**だと指摘しています。

4. 核心:「キツネ」と「ハリネズミ」の逆転

古代ギリシャの詩人から「キツネは多くのことを知っているが、ハリネズミは一つの大きなことを知っている」という言葉があります。

  • ハリネズミ(昔の AI): 一つの「万能の知能(g 因子)」で、すべての問題を解決しようとしていました。
  • キツネ(今の AI): 「道具」を使って、それぞれの分野で異なる戦略(キツネの知恵)を駆使するようになりました。

この論文は、**「AI は、単一の『万能な知能』を持つハリネズミから、多様な『道具使い』であるキツネの集団へと進化している」**と結論づけています。
これにより、AI の能力は「一つの軸(背の高さ)」で測るのではなく、「多次元の複雑な能力の集合体」として捉える必要があります。

5. 結論:「Ptolemaic Succession(プトレマイオスの系譜)」の逆転

天文学の歴史で、プトレマイオスは「地球が中心」という単純な考えを維持するために、惑星の動きを説明するために「エピサイクル(円周上の円)」を次々と追加しました。

  • AI の現状: 今、AI の研究者も同じことをしています。「新しい能力(ツール使用など)」が出るたびに、「新しいテスト」を追加して評価しています。
  • 逆転: しかし、AI は人間とは逆の進化をしています。人間は「単純な法則」を見つけようとしてきましたが、AI は**「複雑な道具(エピサイクル)を次々と追加しても、圧倒的な計算力でそれを統合し、さらに賢くなっている」**のです。

まとめ:この論文が伝えたいこと

  1. AI には「万能な知能(g 因子)」が存在したが、それは「すべてのテストで高得点を取れる」という意味だった。
  2. しかし、AI が「道具」を使い始めると、その「万能性」は薄れ、代わりに「分野ごとの専門性」が浮き彫りになった。
  3. 今後は、AI を「どれくらい賢いか(背の高さ)」で測るのではなく、**「どのような道具を使い、どのような分野でどう活躍するか(多次元の能力)」**で評価する必要がある。
  4. AI の知能は、単体の脳ではなく、「脳+道具」のシステム全体として捉えるべきだ。

一言で言えば:
「AI は、何でもできる『万能の天才』から、道具を駆使してそれぞれの分野で活躍する『多才な専門家集団』へと進化している。だから、昔ながらの『IQ テスト』のような単純な評価基準は、もう通用しなくなってきた」というのが、この論文のメッセージです。

このような論文をメールで受け取る

あなたの興味に合わせた毎日または毎週のダイジェスト。Gistまたは技術要約を、あなたの言語で。

Digest を試す →