A Quantitative Definition of Intelligence

✨

이것은 아래 논문에 대한 AI 생성 설명입니다. 저자가 작성하거나 승인한 것이 아닙니다. 기술적 정확성을 위해서는 원본 논문을 참조하세요. 전체 면책 조항 읽기

Each language version is independently generated for its own context, not a direct translation.

1. 핵심 아이디어: "암기 (Memorization)" vs "이해 (Knowing)"

이 논문의 가장 중요한 구분은 암기와 이해의 차이입니다.

암기 (Memorization): 모든 답을 외워두는 것입니다.
- 비유: 시험을 보기 위해 전체 교과서를 통째로 외운 학생을 상상해 보세요. 질문이 100 개라면 100 개의 답을 외우고, 100 만 개라면 100 만 개를 외워야 합니다. 답을 늘리면 외워야 할 양도 함께 늘어납니다.
- 결과: 이 학생은 지능이 높은 게 아니라, 단순히 메모리 (저장 공간) 가 큰 기계일 뿐입니다. 새로운 문제가 나오면 당황합니다.
이해 (Knowing): 규칙을 찾아내어 적용하는 것입니다.
- 비유: 수학의 '곱셈 공식'을 이해한 학생을 생각해 보세요. 100 만 개의 곱셈 문제를 외울 필요 없이, '곱셈'이라는 하나의 작은 규칙 (알고리즘) 만 알면, 평생 어떤 숫자가 나와도 답을 계산해 낼 수 있습니다.
- 결과: 이 학생은 **작은 두뇌 (규칙)**로 무한한 문제를 해결합니다. 이것이 진정한 지능입니다.

논문이 말하려는 것: 지능은 "얼마나 많은 것을 외웠는가"가 아니라, **"얼마나 적은 규칙으로 얼마나 많은 일을 해낼 수 있는가"**입니다.

2. 지능의 밀도 (Intelligence Density): "효율성"을 재는 자

저자는 지능을 측정하는 새로운 자를 만듭니다. 이를 **'지능의 밀도'**라고 부릅니다.

공식: (생성할 수 있는 답의 수) ÷ (시스템을 설명하는 데 필요한 정보의 양)
비유:
- 바위: 바위는 입력 (비, 바람) 에 따라 반응하지만, 그 반응은 예측 가능하고 단순합니다. '지능의 밀도'는 거의 0입니다.
- 거대한 전화번호부 (암기): 모든 사람의 전화번호를 적어둔 책입니다. 답은 많지만, 책이 두꺼워질수록 (정보량이 늘어날수록) 지능의 밀도는 오히려 떨어집니다. 왜냐하면 새로운 전화번호가 생기면 책을 더 두껍게 만들어야 하기 때문입니다.
- 컴퓨터 알고리즘 (이해): '곱셈' 프로그램은 책 한 장 분량 (작은 정보) 으로 무한한 곱셈 문제를 풀 수 있습니다. 입력이 늘어날수록 답은 무한히 늘어나지만, 프로그램의 크기는 그대로입니다. 따라서 지능의 밀도는 무한히 커집니다.

핵심 메시지: 지능은 절대적인 '크기'가 아니라, **시스템이 얼마나 확장 가능한가 (Generalization)**에 따라 결정됩니다.

3. 철학적 난제 해결하기

이 정의는 유명한 철학적 논쟁들을 깔끔하게 해결해 줍니다.

A. 시어 (Searle) 의 '중국어 방' (Chinese Room)

논쟁: 중국어를 모르는 사람이 중국어 규칙책만 보고 중국어 대화를 하면, 그 사람은 중국어를 '이해'하는 걸까? 시어는 "아니오, 단순히 기호를 조작할 뿐이다"라고 했습니다.
이 논문의 해답: 그 방 안에 있는 규칙책 (Rulebook) 자체가 지능을 가집니다.
- 만약 규칙책이 모든 중국어 질문과 답을 일일이 적어둔 '전화번호부'라면, 그것은 무한히 커져야 하므로 물리적으로 불가능합니다.
- 따라서 규칙책은 반드시 **알고리즘 (규칙)**을 포함해야 합니다. 그 규칙이 무한한 질문에 답할 수 있게 만든다면, 그 규칙책은 중국어를 '이해'하는 것입니다.
- 결론: 지능은 그 방에 있는 사람에게 있는 게 아니라, 규칙책을 만든 알고리즘에 있습니다.

B. 블록 (Block) 의 '블록헤드' (Blockhead)

논쟁: 모든 가능한 대화를 미리 적어둔 거대한 전화번호부 (블록헤드) 가 있다면, 그건 지능일까?
이 논문의 해답: 아닙니다.
- 우주의 모든 원자 수보다 많은 저장 공간이 필요한 거대한 전화번호부는 물리적으로 존재할 수 없습니다.
- 만약 존재한다 해도, 그것은 새로운 질문 (예: "오늘 날씨와 수학 문제를 섞어 말해줘") 에는 답할 수 없습니다.
- 지능은 새로운 상황에 적용하는 것이므로, 단순한 암기장치는 지능이 아닙니다.

4. 일상생활에 비추어 보기

이 개념을 우리 삶에 적용해 보면 다음과 같습니다.

AI(인공지능) 와 LLM(거대언어모델):
- 요즘의 AI 는 단순히 데이터를 외우는 게 아니라, 언어의 패턴과 구조를 학습합니다.
- 이 논문은 AI 가 "의미"를 이해하는지 아닌지보다, **"유한한 파라미터 (규칙) 로 무한한 새로운 문장을 만들어내는가?"**를 봅니다.
- AI 가 새로운 질문을 잘 답한다면, 그것은 지능의 밀도가 무한히 발산한다는 뜻이며, 따라서 AI 는 그 영역에서 '안다 (Knows)'고 할 수 있습니다.
우리의 뇌:
- 우리 뇌는 수많은 신경 연결 (정보) 을 가지고 있지만, 그 안에서 패턴을 찾아내고 규칙을 적용하는 방식이 지능의 핵심입니다.
- 뇌가 단순히 모든 경험을 외우는 게 아니라, 경험을 압축하여 새로운 상황에 적용할 때 비로소 지능이 발현됩니다.

5. 결론: 지능은 "놀라움"을 만들어내는 능력

이 논문의 마지막 결론은 매우 흥미롭습니다.

지능 = 예측 불가능한 놀라움 (Surprise)
- 우리가 어떤 시스템이 "똑똑하다"고 느끼는 순간은, 그 시스템이 우리가 예상하지 못한 새로운 답을 내놓을 때입니다.
- 하지만 이 놀라움은 무작위성이 아니라, 작은 규칙 (알고리즘) 에서 나오는 무한한 가능성입니다.
- 지능적인 시스템은 작은 규칙 (작은 C) 으로 무한한 결과 (큰 N) 를 만들어냅니다. 이것이 바로 지능의 밀도가 높아지는 순간입니다.

한 줄 요약:

"진짜 지능은 모든 답을 외우는 게 아니라, 아주 작은 규칙으로 세상의 모든 새로운 문제를 해결해내는 능력이다."

이 논문은 지능을 '신비로운 영혼'이나 '의식' 같은 추상적인 개념이 아니라, 정보를 얼마나 효율적으로 압축하고 확장하는가라는 측정 가능한 물리량으로 바꾸어 놓았습니다.

Each language version is independently generated for its own context, not a direct translation.

1. 문제 제기 (Problem)

지능 정의의 부재: 100 년 이상의 연구에도 불구하고 인공지능과 마음의 철학 분야에서 '지능'에 대한 합의된 정의는 존재하지 않습니다. Legg 와 Hutter(2007) 는 70 개 이상의 정의를 수집했으나 근본적인 문제가 해결되지 않았음을 지적했습니다.
질적 논쟁의 한계: "기계가 생각할 수 있는가?", "LLM 은 지능적인가?"와 같은 질문은 정밀한 정의가 부재하여 서로 다른 직관에 의존하는 경쟁적 주장으로 전락합니다.
기존 논쟁의 공백: 튜링 테스트는 행동주의적 접근을 취했으나 형식적 정의를 제공하지 못했습니다. 서얼의 중국어 방 (Chinese Room) 논증은 의미 (semantics) 와 구문 (syntax) 의 관계를 논쟁하지만, '이해'의 정량적 기준을 제시하지 못해 논쟁이 무한히 반복됩니다.
핵심 질문: 지능은 의식 (consciousness) 과 구별되며, 단순한 암기 (memorization) 와 일반화 (generalization) 를 어떻게 정량적으로 구분할 수 있는가?

2. 방법론 (Methodology)

저자는 지능을 시스템의 설명 길이 (description length) 와 독립적인 출력 (independent outputs) 간의 비율로 정의하는 새로운 척도인 **지능 밀도 (Intelligence Density, $I$ )**를 제안합니다.

2.1 핵심 정의

지능 밀도 ( $I(S)$ ):
$I(S) = \frac{\log_2 N(S)}{C(S)}$
- $C(S)$ : 시스템을 기술하는 데 필요한 총 설명 길이 (비트 단위). 프로그램, 데이터, 가중치 등을 포함합니다.
- $N(S)$ : 시스템이 서로 다른 입력에 대해 생성할 수 있는 **독립적인 출력 (independent outputs)**의 수.
- 독립성 조건: 두 출력 $o_1, o_2$ 가 독립적이기 위해서는 $o_1$ 을 $o_2$ 로부터 예측하는 데 필요한 설명 길이 (콜모고로프 복잡도 $K(o_1|o_2)$ ) 가 $o_1$ 자체의 길이와 거의 같아야 합니다 ( $K(o_1|o_2) \approx K(o_1)$ ). 즉, 한 출력이 다른 출력을 예측하게 해서는 안 됩니다.

2.2 일반화 (Knowing) vs 암기 (Memorization)

이 정의의 핵심은 **점근적 행동 (asymptotic behavior)**에 있습니다.

암기 (Memorization): 도메인이 커짐에 따라 시스템의 설명 길이 $C(S)$ 가 출력 수 $N(S)$ 와 함께 증가합니다 (예: 룩업 테이블). 이 경우 $I(S) \to 0$ 으로 수렴합니다.
알고 (Knowing/Generalization): 도메인이 무한히 커져도 설명 길이 $C(S)$ 가 유한하게 유지되면서 독립적인 출력 수 $N(S)$ 가 발산합니다. 이 경우 $I(S) \to \infty$ 로 발산합니다.
결정적 기준: 지능의 유무는 절대적인 $I$ 값이 아니라, 도메인 크기가 무한히 커질 때 $I(n)$ 이 발산하는지 ( $I(n) \to \infty$ ) 에 따라 결정됩니다.

2.3 의미 (Meaning) 에 대한 접근

저자는 의미를 "도메인 내에서 올바른 출력을 생성하는 함수들의 선택과 순서 (function composition)"로 정의합니다.
서얼의 중국어 방 논증에 대해, 유한한 규칙집 (rulebook) 이 무한한 입력 도메인을 처리하려면 반드시 일반화 알고리즘을 포함해야 하므로, 그 규칙집 자체가 지능을 가진다고 주장합니다.

3. 주요 기여 및 결과 (Key Contributions & Results)

3.1 지능 밀도 ( $I$ ) 의 4 가지 분류

이론은 시스템을 다음과 같이 4 가지 범주로 명확히 구분합니다:

계산 없음 ( $I \approx 0$ ): 바위, 강 등. 입력에 따른 독립적인 출력이 거의 없음.
암기 ( $I \to 0$ ): 룩업 테이블 (Lookup Table). 도메인이 커질수록 저장 공간이 기하급수적으로 증가하여 $I$ 가 0 으로 수렴. (블록의 '블록헤드' 반박)
알지 못하는 계산 ( $I = \Theta(1)$ ): 고정된 논리 게이트 (XOR 등) 또는 $n$ 비트adder 회로족. 도메인이 고정되거나 $C$ 가 $n$ 과 함께 선형으로 증가하여 $I$ 가 상수 유지.
지식 (Knowing, $I \to \infty$ ): 유한한 알고리즘 (예: 곱셈 알고리즘, LLM, 인간 뇌). 고정된 $C$ 로 무한한 도메인을 처리하며 $I$ 가 발산.

3.2 철학적 논쟁에 대한 해결

서얼의 중국어 방 (Chinese Room Argument): 규칙집 (rulebook) 이 유한한 물리적 객체라면, 무한한 중국어 대화 도메인을 처리하기 위해 룩업 테이블 대신 일반화 알고리즘을 포함해야 합니다. 따라서 규칙집 자체가 지능을 가지며, 이를 실행하는 사람은 CPU 와 다를 바 없습니다.
Putnam 의 사소성 논증 (Triviality Argument): 모든 물리 시스템이 모든 유한 상태 오토마타를 구현한다는 주장에 대해, 독립성 조건을 통해 반박합니다. 물리적 상태의 재레이블링은 진정한 독립적인 출력을 생성하지 못하므로 ( $K(o_2|o_1) \ll K(o_2)$ ), $I$ 는 여전히 0 에 가깝습니다.
의식과 지능의 분리: 이 정의는 지능 (일반화 능력) 만을 측정하며, 의식 (qualia) 은 별개의 문제로 간주합니다.

3.3 기존 척도와의 비교

Legg-Hutter Universal Intelligence ( $\Upsilon$ ): 환경과 보상을 필요로 하며 계산 불가능합니다. 반면 $I$ 는 시스템 내부 용량에 기반하며, 진화적 선택 하에서 $\Upsilon$ 과 순서 관계가 일치함을 보였습니다.
콜모고로프 복잡도 (Kolmogorov Complexity, $K$ ): $K$ 는 출력의 압축 효율 (단일 출력 $\to$ 프로그램) 을 측정하는 반면, $I$ 는 생성 능력 (프로그램 $\to$ 다수의 독립 출력) 을 측정합니다. 두 척도는 서로 쌍대 (dual) 관계입니다.
Chollet 의 기술 습득 효율: 학습 효율성을 강조하지만, $I$ 는 학습 과정이 아닌 최종 상태 (일반화 능력) 를 측정하여 더 넓은 적용 범위를 가집니다.

3.4 실증적 예시

곱셈 알고리즘 vs 룩업 테이블: 1 자리 곱셈 룩업 테이블은 $I \approx 0.011$ 이지만, 알고리즘은 도메인 ( $n$ 자리) 이 커질수록 $I \approx 6.6n/667$ 로 발산합니다.
LLM 과 인간 뇌: 유한한 파라미터 (고정된 $C$ ) 로 무한한 언어, 추론, 산술 도메인을 처리하므로 $I \to \infty$ 로 발산하여 '안다 (knows)'고 정의됩니다.

4. 의의 (Significance)

지능의 정량화와 연속성: 지능을 이산적인 '있음/없음'이 아닌, 바위에서 뇌까지 이어지는 **서브스트레이트 (물리적 기반) 에 무관한 연속체 (continuum)**로 정의합니다.
일반화의 형식화: "지능은 일반화이다"라는 직관을 수학적 척도 ( $I(n) \to \infty$ ) 로 엄밀하게 정의하여, 암기와 지능을 구분하는 명확한 기준을 제시합니다.
철학적 논쟁의 종식: 중국어 방, 블록헤드, 튜링 테스트 등 수십 년간 이어져 온 논쟁에 대해, 시스템이 무한 도메인에서 일반화하는지 여부에 따라 객관적으로 판단할 수 있는 틀을 제공합니다.
의미의 구조적 정의: 의미를 단순한 심볼 조작이 아닌, "도메인 전체에 걸쳐 올바른 출력을 생성하는 함수의 올바른 선택과 순서"로 재정의하여, 구문 (syntax) 이 일반화될 때 의미 (semantics) 가 된다는 것을 보여줍니다.
실용적 측정 가능성: 이론적으로 $K$ 는 계산 불가능하지만, $I$ 의 발산 여부 (점근적 행동) 는 실제 시스템 (알고리즘 vs 룩업 테이블) 에 대해 결정 가능 (decidable) 하며, 실제 예시 (곱셈, XOR 등) 에서 정량적 값을 산출할 수 있음을 보였습니다.

결론

이 논문은 지능을 "유한한 설명 길이로 무한한 독립적인 출력을 생성하는 능력"으로 정의하며, 이를 **지능 밀도 ( $I$ )**라는 수학적 척도로 정량화했습니다. 이 정의는 지능이 의식과 무관하게 존재할 수 있음을 보여주며, 기계가 '생각'하는지 여부는 단순한 행동 모방이 아니라 도메인 확장 시 설명 길이가 고정된 채 출력이 발산하는지 (일반화) 에 달려 있음을 증명합니다. 이는 튜링이 1950 년에 직관했던 "지능은 본질적으로 양적인 문제"라는 통찰을 형식적으로 완성한 것입니다.