Memex(RL): Scaling Long-Horizon LLM Agents via Indexed Experience Memory

이 논문은 장기 작업에서 LLM 에이전트의 컨텍스트 윈도우 한계를 극복하기 위해, 완전한 상호작용 기록을 외부 데이터베이스에 보관하고 요약본과 인덱스만 컨텍스트에 유지하며 강화학습을 통해 최적의 요약·아카이빙·검색 전략을 학습하는 'Memex' 메모리 메커니즘을 제안합니다.

Zhenting Wang, Huancheng Chen, Jiayun Wang, Wei Wei

게시일 2026-03-05
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🧠 메모릭스 (Memex): AI 가 "기억력"을 잃지 않는 비결

이 논문은 대형 언어 모델 (LLM) 이 아주 긴 작업을 할 때 겪는 치명적인 약점을 해결한 새로운 기술을 소개합니다. 바로 **'메모릭스 (Memex)'**라는 시스템입니다.

이걸 이해하기 쉽게 일상적인 비유로 설명해 드릴게요.


1. 문제: "머릿속이 너무 꽉 찼어요!" 🤯

지금까지의 AI 는 마치 한 번에 100 장의 메모만 기억할 수 있는 사람처럼 행동했습니다.

  • 상황: AI 가 복잡한 미션을 수행하다 보면 (예: 100 단계에 걸친 코드 수정, 논문 조사 등), 중간중간 얻은 정보, 도구 사용 결과, 생각 과정이 계속 쌓입니다.
  • 문제: 100 장의 메모가 다 차면, AI 는 더 이상 새로운 정보를 받아들일 수 없거나, 가장 중요한 첫 번째 메모를 잊어버리게 됩니다.
  • 기존 해결책의 한계: 사람들은 "기억이 안 나니까 요약해서 1 줄로 줄이자!"라고 했습니다. 하지만 요약하면 중요한 디테일 (숫자, 코드, 오류 메시지 등) 이 사라져서 나중에 다시 쓸 때 엉뚱한 결론을 내리게 됩니다.

비유: 긴 여행 중 일기장을 계속 쓰는데, 페이지가 다 차자 "이전 일기 다 버리고 '오늘은 행복했다'는 한 줄만 남기자!"라고 한다면, 나중에 "어디서 무엇을 먹었지? 어떤 버스를 탔지?"를 기억할 수 없겠죠.


2. 해결책: 메모릭스 (Memex) 의 등장 📚✨

이 논문은 **"기억을 버리는 게 아니라, 정리해서 따로 보관하자"**는 아이디어를 제시합니다.

🏢 비유: "작업대"와 "창고"

메모릭스는 AI 의 기억 방식을 두 곳으로 나눕니다.

  1. 작업대 (작업용 메모): AI 가 지금 당장 보고 있는 좁은 공간입니다. 여기엔 핵심 요약과 **보관함 번호 (인덱스)**만 적혀 있습니다.
  2. 창고 (외부 데이터베이스): 모든 상세한 정보 (원본 일기, 코드, 오류 로그 등) 가 꽉 찬 채로 안전하게 보관된 곳입니다.

어떻게 작동하나요?

  • 압축 (Compress): 정보가 너무 많아지면, AI 는 "자, 이 10 페이지짜리 대화 내용을 1 줄 요약하고, 원본은 창고 3 번 선반에 넣어두자"라고 말합니다.
  • 인덱싱 (Indexing): 요약 내용 옆에 **"창고 3 번 선반"**이라는 라벨을 붙여둡니다.
  • 찾아오기 (Dereference): 나중에 그 정보가 다시 필요해지면, AI 는 "아, 창고 3 번 선반에서 가져와!"라고 명령합니다. 그럼 원본 정보가 그대로 작업대로 다시 돌아옵니다.

핵심 차이점: 기존 방식은 "요약본"만 남겼다면, 메모릭스는 **"요약본 + 원본이 있는 곳의 주소"**를 남깁니다. 그래서 필요한 순간에 정확한 원본을 다시 꺼낼 수 있습니다.


3. 학습 방법: "메모리 RL" (MemexRL) 🎮🧠

하지만 AI 가 스스로 "어떤 걸 요약하고, 언제 창고에 넣을지"를 알 수 있을까요? 여기엔 **보상 학습 (RL)**이 쓰였습니다.

  • 게임 규칙: AI 는 미션을 성공해야 하고, 작업대 (메모리) 가 넘치지 않게 해야 합니다.
  • 페널티 (벌점):
    • 작업대가 너무 꽉 차서 정보가 넘치면 벌점.
    • 같은 일을 반복해서 물어보면 벌점.
    • 문법 틀린 명령을 내리면 벌점.
  • 보상: 미션을 성공하면 점수.

AI 는 수많은 시도를 통해 **"언제 요약하고, 언제 창고에서 꺼내야 미션을 잘 끝낼 수 있는지"**를 스스로 배웁니다. 마치 숙련된 비서가 "중요한 건 바로 옆에 두고, 자주 안 쓰는 건 파일함 (인덱스) 에 정리해 두는 법"을 터득하는 것과 같습니다.


4. 결과: 더 똑똑해지고, 더 가볍게 🚀

실험 결과, 이 기술을 적용한 AI 는 다음과 같은 변화를 보였습니다.

  • 성공률 급상승: 긴 미션 성공률이 24% 에서 85% 로 크게 향상되었습니다.
  • 메모리 효율: 필요한 정보를 잃지 않으면서도, 작업에 쓰는 메모리 양은 약 43% 줄었습니다.
  • 행동 변화: AI 는 정보를 자주 요약하기보다는, 적절한 때에 창고에서 정확한 정보를 꺼내 쓰는 법을 배웠습니다.

📝 한 줄 요약

"메모릭스 (Memex)"는 AI 가 긴 작업을 할 때, 중요한 정보를 잃어버리지 않으면서도 머릿속 (메모리) 을 비우기 위해 '요약본'과 '원본 보관소 주소'를 따로 관리하게 해주는 똑똑한 비서 시스템입니다.

이 기술 덕분에 AI 는 이제 인간의 긴 프로젝트나 복잡한 조사 작업에서도 기억력 부족이라는 약점을 극복하고, 훨씬 더 길고 정교한 임무를 수행할 수 있게 되었습니다.