이것은 동료 심사를 거치지 않은 프리프린트의 AI 생성 설명입니다. 의학적 조언이 아닙니다. 이 내용을 바탕으로 건강 관련 결정을 내리지 마세요. 전체 면책 조항 읽기
Each language version is independently generated for its own context, not a direct translation.
이 논문은 **"인공지능 (AI) 이 정말로 '만능 천재'가 되어가고 있는가, 아니면 각자 다른 재능을 가진 '전문가'들이 모여 있는 것인가?"**라는 질문에 통계학적 분석을 통해 답하려는 흥미로운 연구입니다.
저자 데이비드 크라카워는 심리학에서 오랫동안 논의되어 온 '일반 지능 (g)' 개념을 AI 에 적용해 보았습니다. 쉽게 말해, "한 가지 일을 잘하면 다른 모든 일도 잘하는가?"를 AI 벤치마크 점수들을 분석하며 확인한 것입니다.
이 복잡한 논문을 일상적인 언어와 비유로 풀어서 설명해 드리겠습니다.
1. 핵심 비유: "모든 것을 잘하는 천재 (호랑이)" vs "각자 특기를 가진 여우들"
과거 심리학자들은 인간이 지능 테스트에서 한 과목 (예: 수학) 을 잘하면 다른 과목 (예: 언어) 도 잘하는 경향이 있다고 보았습니다. 이를 **'일반 지능 (g)'**이라고 불렀습니다. 마치 한 마리 거대한 호랑이가 모든 사냥터를 지배하는 것처럼 말이죠.
AI 커뮤니티도 비슷하게 생각했습니다. "GPT-4 같은 모델은 수학도 잘하고, 코딩도 잘하고, 의학 지식도 있으니, 이건 진짜 '범용 인공지능 (AGI)'이구나!"라고 믿었습니다.
하지만 이 논문은 2019 년부터 2025 년까지 나온 39 개의 AI 모델과 14 가지 시험 점수를 분석하며 놀라운 사실을 발견했습니다.
결론: AI 는 점점 더 '범용 천재'가 아니라, 각자 특기를 가진 '여우들'의 무리로 변하고 있습니다.
2. 이야기의 흐름: "호랑이의 부활과 몰락"
1 단계: 호랑이의 전성기 (2023 년 초~중반)
처음에는 AI 모델들이 발전할 때, 모든 시험 점수가 동시에 뻥튀기되었습니다.
- 비유: 마치 한 팀의 운동선수가 훈련을 받자마자 달리기, 수영, 농구, 축구 실력이 모두 똑같이 비약적으로 향상된 것처럼요.
- 이때는 '일반 지능 (G)'이 90% 이상을 설명했습니다. 즉, "이 모델은 뭐든 잘한다"는 한 가지 척도로 모든 것을 설명할 수 있었습니다.
2 단계: 호랑이의 분열 (2024 년 말 이후)
그런데 2024 년 말부터 상황이 바뀝니다. AI 회사들이 "우리는 이제 모든 것을 다 잘하는 모델보다, 특정 일에 집중하는 모델을 만들자"라고 전략을 바꿨기 때문입니다.
- 새로운 등장인물: 'o1'이나 'DeepSeek R1' 같은 모델들은 **추론 (Reasoning)**에 특화되어 복잡한 수학 문제를 푼 반면, 다른 모델들은 코드 작성이나 기억력에 특화되었습니다.
- 비유: 이제 운동선수가 "달리기만 잘하는 선수"와 "수영만 잘하는 선수"로 나뉜 것입니다.
- 결과: '일반 지능 (G)'이 설명하는 점수 비중이 90% 에서 77% 로 떨어졌습니다. AI 는 더 이상 "무엇이든 잘하는 호랑이"가 아니라, 서로 다른 재능을 가진 **여우들 (전문가)**이 모여 있는 사회가 된 것입니다.
3. 중요한 발견: "도구를 쓰는 지능"
논문은 AI 의 지능이 모델 자체에 있는 것이 아니라, 모델이 사용하는 도구에 있다는 점을 강조합니다.
- 과거의 AI: 시험지를 보고 혼자서 모든 문제를 풀어야 했습니다. (사람이 펜 없이 시험을 보는 것과 같음)
- 현재의 AI: 계산기, 검색 엔진, 코드 실행기 같은 도구를 사용해서 문제를 풉니다.
- 비유: 인간이 지능이 좋아진 것이 아니라, 문자, 책, 인터넷이라는 도구를 발명해서 지능을 확장했듯이, AI 도 이제 외부 도구를 써서 지능을 확장하고 있습니다.
따라서 "이 AI 가 혼자서 얼마나 똑똑한가?"를 묻는 것은 의미가 없어지고, **"이 AI 가 어떤 도구를 어떻게 활용하는가?"**를 보는 것이 중요해졌습니다.
4. 지구의 궤도 비유: "지동설의 반전"
저자는 과학사의 유명한 비유를 사용합니다.
- 프톨레마이오스 (고대): 천체의 움직임을 설명하기 위해 복잡한 원 (주전원) 을 계속 덧붙였습니다. (AI 벤치마크가 계속 늘어나는 상황)
- 케플러/뉴턴 (근대): 단순한 법칙 하나로 모든 것을 설명하려 했습니다. (단순한 '일반 지능' 하나로 모든 AI 를 설명하려 했던 시도)
이 논문은 흥미롭게도 AI 는 프톨레마이오스식으로 복잡해지고 있다고 말합니다.
- AI 는 단순한 하나의 법칙 (일반 지능) 으로 설명되지 않습니다.
- 대신, 복잡한 도구와 전문성들이 얽혀서 거대한 지능을 만들어냅니다.
- 이는 나쁜 일이 아닙니다. 오히려 인간의 뇌가 단순한 하드웨어가 아니라, 도구와 결합된 시스템이라는 사실을 AI 가 증명하고 있는 것입니다.
5. 요약: 우리가 무엇을 알아야 할까?
- AI 는 '만능 천재'가 아닙니다: AI 는 점점 더 각자 특기를 가진 전문가 집단으로 변하고 있습니다. (수학 천재, 코딩 천재, 기억력 천재 등)
- '지능'의 정의가 바뀝니다: AI 가 혼자서 문제를 푸는 능력보다, 어떤 도구를 어떻게 활용해서 문제를 해결하는가가 더 중요한 지능의 척도가 됩니다.
- 벤치마크의 한계: 과거의 시험 (벤치마크) 은 AI 가 혼자 문제를 푸는 능력을 측정했지만, 이제는 AI 가 도구를 쓰는 능력을 측정해야 합니다.
한 줄 요약:
"AI 는 더 이상 모든 것을 다 잘하는 '단일 천재'가 아니라, 각자 다른 도구를 들고 서로 다른 일을 해내는 '지능의 사회'가 되어가고 있습니다. 우리는 이제 '얼마나 똑똑한가'가 아니라 '어떻게 지능을 확장하는가'를 봐야 합니다."
이런 논문을 받은편지함으로 받아보세요
관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.