Artificial Agency Program: Curiosity, compression, and communication in agents

이 논문은 물리적·계산적 제약 하에서 호기심 (학습 진전) 을 동력으로 삼아 인간과 도구의 확장된 시스템으로 AI 를 구축하기 위한 예측 압축, 내재적 동기, 권한 부여, 인터페이스 통합, 언어 소통 등을 통합한 검증 가능한 '인공 에이전트 프로그램 (AAP)' 연구 계획을 제시합니다.

Richard Csaky

게시일 2026-03-02
📖 4 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🎒 핵심 비유: "현실 세계를 탐험하는 등산가"

지금까지의 AI 는 마치 무한한 배낭과 무한한 식량을 가진 등산가처럼 훈련되었습니다. 모든 길을 다 걸어보고, 모든 지도를 다 외운 뒤 정답을 말해줍니다. 하지만 현실 세계는 다릅니다. 우리는 배낭이 작고, 에너지가 제한적이며, 길을 잃을 수도 있습니다.

이 논문은 AI 를 **"제한된 배낭을 가진 현실의 등산가"**로 다시 설계하자고 말합니다.

1. 호기심은 "예측의 발전"에서 온다 (Curiosity as Learning Progress)

  • 기존 방식: AI 는 "무엇이든 새로우면" 호기심을 느낍니다. (예: "이건 처음 보는 색이네!" -> 무작위 탐색)
  • 이 논문의 제안: 진정한 호기심은 **"내가 지금 당장 이해할 수 있지만, 아직 완벽하지 않은 것"**을 발견할 때 생깁니다.
    • 비유: 어린아이가 블록을 쌓을 때, 이미 다 쌓은 블록 (너무 쉬움) 이나 전혀 이해할 수 없는 복잡한 수학 공식 (너무 어려움) 에는 관심이 없습니다. 하지만 "조금만 더 쌓으면 탑이 완성될 것 같은" 그 순간에 가장 집중합니다.
    • AI 도 마찬가지입니다. 자신의 능력 범위 내에서 "예측을 더 잘하게 되는" 패턴을 찾아내는 것이 진정한 학습의 동력입니다.

2. 제한된 자원과 효율성 (Energy & Constraints)

  • 문제: AI 가 매번 "최고의 성능"을 내려고 모든 전력을 다 쏟으면, 배터리가 금방 닳고 비용이 너무 많이 듭니다.
  • 해결책: AI 는 스마트한 관리자가 되어야 합니다.
    • 비유: 등산가가 길을 갈 때, 평지에서는 가볍게 걷고 (적은 계산), 험한 산길에서는 멈춰서 지도를 보고 방향을 잡습니다 (많은 계산).
    • 이 논문은 AI 가 **"언제 관찰할지, 언제 행동할지, 언제 혼자 생각할지 (고민할지)"**를 스스로 결정하는 '메타 컨트롤러'를 갖춰야 한다고 말합니다. 모든 순간에 100% 를 발휘하는 것이 아니라, 상황에 맞춰 에너지를 아끼는 것이 진짜 지능입니다.

3. 인간과 도구의 확장 (Extended Agency)

  • 핵심: AI 는 인간과 분리된 '별개의 존재'가 아니라, 인간의 눈과 손, 머리를 확장해 주는 도구여야 합니다.
  • 비유: 안경을 쓴 사람은 더 멀리 볼 수 있고, 망치 든 사람은 더 단단한 벽을 뚫을 수 있습니다. AI 도 인간이 가진 '제한된 감각'과 '제한된 행동력'을 확장해 주는 안경이자 망치가 되어야 합니다.
  • 중요한 점은 AI 가 인간처럼 제한된 환경 (시간, 에너지, 기억력) 속에서 작동해야 한다는 것입니다. 인간이 1000 년 전에는 미시세계를 궁금해하지 못했던 것처럼, AI 도 자신의 감각과 행동 범위에 맞춰 호기심을 가져야 합니다.

4. 언어는 '소통의 도구'일 뿐, '생각의 필수품'은 아니다 (Language as a Bottleneck)

  • 통념: AI 는 무조건 말을 해야만 생각한다고 믿습니다.
  • 이 논문의 제안: 언어는 정보를 압축해서 전달하는 하나의 채널일 뿐입니다. 때로는 말없이 머릿속으로만 생각 (고민) 하는 것이 더 효율적일 수 있습니다.
    • 비유: 복잡한 문제를 풀 때, 누군가에게 설명하기 위해 "말"을 해야만 하는 것은 아닙니다. 때로는 머릿속으로 그림을 그리거나, 손으로 연필을 움직여 계산하는 것이 더 빠를 수 있습니다.
    • AI 도 상황에 따라 **"말할지 (출력), 말하지 않고 생각할지 (내부 고민), 행동할지"**를 선택할 수 있어야 합니다. 언어는 무조건 좋은 것이 아니라, 비용 (에너지, 시간) 대비 효과가 있을 때만 사용하는 도구여야 합니다.

🧪 이 논문의 실험 계획 (어떻게 증명할까?)

저자는 이 아이디어를 증명하기 위해 3 단계 실험을 제안합니다.

  1. 단계 1 (가상 세계): 간단한 미로 같은 게임에서 센서 (눈) 의 해상도를 낮추거나, 행동할 수 있는 횟수를 제한해 봅니다. AI 가 제한된 조건에서 어떻게 학습하는지 봅니다.
  2. 단계 2 (퍼즐 해결): ARC-AGI 같은 추리 퍼즐을 풀 때, AI 가 "더 많은 정보를 볼까?", "혼자 더 생각할까?", "바로 행동할까?"를 스스로 결정하게 합니다.
  3. 단계 3 (실제 로봇/다중 모드): 실제 이미지, 소리, 텍스트를 모두 처리하는 AI 에게 "에너지 예산"을 주고, 이 예산을 어떻게 쓰면 가장 좋은 결과를 얻는지 실험합니다.

💡 결론: 왜 이 논문이 중요한가?

지금까지 우리는 AI 가 **"얼마나 많은 문제를 풀 수 있는지 (성능)"**만 중요하게 생각했습니다. 하지만 이 논문은 **"얼마나 효율적으로, 인간과 함께, 현실의 제약 안에서 문제를 풀 수 있는지 (효율성과 적응력)"**가 더 중요하다고 말합니다.

한 줄 요약:

"진짜 똑똑한 AI 는 무한한 전력을 가진 슈퍼컴퓨터가 아니라, 제한된 배낭을 들고 현실 세계를 탐험하며, 언제 멈추고 언제 움직일지 스스로 판단하는 현명한 등산가여야 한다."

이러한 관점은 AI 가 인간 사회에 더 자연스럽게 녹아들고, 에너지를 아끼며, 인간과 협력하는 '실용적인 도구'가 되는 길을 열어줍니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →