Understand Then Memory: A Cognitive Gist-Driven RAG Framework with Global Semantic Diffusion

이 논문은 인간의 에피소드 기억 메커니즘에서 영감을 받아 의미적 요점 (Semantic Gist) 추출과 글로벌 의미 확산을 통해 복잡한 지식 통합 및 추론 능력을 획기적으로 향상시킨 새로운 RAG 프레임워크인 'CogitoRAG'를 제안하고 그 우수성을 입증합니다.

Pengcheng Zhou, Haochen Li, Zhiqiang Nie, JiaLe Chen, Qing Gong, Weizhen Zhang, Chun Yu

게시일 Tue, 10 Ma
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🧠 핵심 아이디어: "이해하고 나서 기억하자" (Understand Then Memory)

기존의 인공지능 (RAG) 은 도서관에서 책을 찾을 때, 단어만 맞춰서 책을 찾아내는 방식이었습니다. 예를 들어 "사과"라는 단어가 들어간 책만 찾아내지, 그 책이 "사과派"인지 "사과派"인지, 혹은 "사과를 먹은 후"에 대한 이야기인지 문맥을 깊이 이해하지 못했습니다. 그래서 엉뚱한 책을 가져오거나, 책 내용을 왜곡해서 답을 만들기도 했습니다.

하지만 CogitoRAG는 사람 뇌의 기억 방식을 따라갑니다.

1. 도서관 사서 vs. 지혜로운 도서관장 (기존 vs. CogitoRAG)

  • 기존 방식 (단순 검색):
    도서관에 책이 100 권 들어오면, 사서는 책 표지에 적힌 단어만 보고 책장에 꽂습니다. 나중에 "누가 사과를 먹었니?"라고 물으면, '사과'라는 단어가 있는 책 10 권을 쭉 꺼내서 보여줍니다. 하지만 그 책들이 서로 어떤 관계인지, 어떤 이야기인지 모릅니다.

  • CogitoRAG 방식 (이해 후 기억):
    이 시스템은 책이 들어오자마자 도서관장이 책 내용을 한 번 읽어보고 요약합니다.

    • "아, 이 책은 '사과'에 대한 게 아니라, '사과를 먹은 후 배가 아픈 이야기'구나."
    • "이 책은 '사과'와 '오렌지'의 관계를 설명하는 거구나."

    이렇게 **내용의 핵심 (Gist, gist)**을 파악한 뒤, 단순한 책장이 아니라 **상상력 지도 (지식 그래프)**를 그립니다. 이 지도에는 책 내용뿐만 아니라, 사람 뇌가 기억하는 '장면'과 '연상 작용'까지 모두 연결해 둡니다.

2. 질문을 부수는 마법 (질문 분해 모듈)

사용자가 아주 복잡한 질문을 했을 때, CogitoRAG 는 한 번에 답하려 하지 않습니다.

  • 질문: "배트맨과 스파이더맨이 같은 감독이 만든 영화에 나왔다면, 그 감독은 몇 살일까?"

  • 기존 방식: 이 질문을 한 번에 처리하려다 혼란스러워 엉뚱한 답을 냅니다.

  • CogitoRAG 방식: 사람의 뇌처럼 질문을 조각조각 뜯어봅니다.

    1. 배트맨 감독은 누구야?
    2. 스파이더맨 감독은 누구야?
    3. 두 감독이 같은가?
    4. 같다면 그 감독의 나이는?

    이렇게 작은 질문으로 나누어 하나씩 해결한 뒤, 마지막에 퍼즐을 맞춰 최종 답을 냅니다.

3. 지식의 확산 (엔티티 확산 모듈)

지도에서 정보를 찾을 때, CogitoRAG 는 단순히 "이 단어랑 비슷한 거"만 찾지 않습니다.

  • 비유: "사과"를 검색하면, 단순히 '사과'라는 글자가 있는 곳만 찾는 게 아니라, **'사과'와 연결된 '나무', '과일', '건강', '뉴욕'**까지 자연스럽게 생각하며 정보를 찾아냅니다.
  • 이 시스템은 지식 지도 위에서 정보를 물방울이 퍼지듯 (Diffusion) 확산시킵니다. 중요한 정보일수록 더 많이 퍼지고, 덜 중요한 정보는 자연스럽게 사라지게 하여 가장 핵심적인 정보만 모읍니다.

4. 최고의 답을 골라내는 심사위원 (CogniRank)

찾아낸 정보들이 너무 많다면? CogitoRAG 는 심사위원 역할을 합니다.

  • 단순히 검색어와 비슷한지 (표면적 유사성) 만 보는 게 아니라, **전체적인 이야기 흐름 (맥락)**과 정보의 중요도를 함께 고려해 순위를 매깁니다.
  • 마치 "이 정보는 질문의 핵심을 찌르지만, 저 정보는 그냥 관련 단어만 비슷하네"라고 판단하여 가장 정확한 정보만 골라냅니다.

🌟 왜 이것이 중요한가요?

기존 인공지능은 조각난 퍼즐 조각만 가지고 답을 만들려고 해서, 때로는 논리적으로 맞지 않는 엉뚱한 이야기를 지어냈습니다 (할루시네이션).

하지만 CogitoRAG는:

  1. 내용을 먼저 이해하고 (요약 및 핵심 추출),
  2. 상호 연결된 지도를 만들고,
  3. 질문을 나누어 생각하며,
  4. 전체적인 맥락을 고려해 답을 찾습니다.

이 덕분에 복잡한 추론이 필요한 질문이나, 여러 문서를 넘나드는 긴 이야기를 다룰 때 훨씬 더 똑똑하고 정확한 답을 내놓습니다. 마치 사람이 책을 읽을 때 단순히 글자만 외우는 게 아니라, 이야기의 흐름을 이해하고 기억하는 것과 같습니다.

📝 한 줄 요약

"CogitoRAG 는 인공지능에게 '단순한 검색'이 아닌, '이해와 기억'을 가르쳐서 더 똑똑하고 정확한 답변을 하게 만든 새로운 뇌 구조입니다."