Semantic XPath: Structured Agentic Memory Access for Conversational AI

이 논문은 컨텍스트 창 제한과 평면적 메모리 접근법의 한계를 극복하기 위해 계층적 트리 구조를 기반으로 한 'Semantic XPath'를 제안하여, 기존 RAG 대비 성능을 176.7% 향상시키고 토큰 사용량을 9.1%로 획기적으로 줄인 대화형 AI 시스템의 새로운 패러다임을 제시합니다.

Yifan Simon Liu, Ruifan Wu, Liam Gallagher, Jiazhou Liang, Armin Toroghi, Scott Sanner

게시일 2026-03-03
📖 4 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🗣️ 대화형 AI 의 '기억력'을 혁신한 새로운 방법: "시맨틱 XPath"

이 논문은 대화형 AI(예: 챗봇, 비서) 가 오랜 시간 동안 복잡한 일을 도와줄 때, 어떻게 기억을 효율적으로 관리하고 찾아낼 수 있는지에 대한 획기적인 해결책을 제시합니다.

이 내용을 일상적인 비유로 쉽게 설명해 드릴게요.


1. 문제: AI 는 왜 망각증에 걸릴까요? 🤔

지금까지의 AI 는 두 가지 방식으로 기억을 처리했습니다.

  • 방법 A: "모든 것을 입에 물고 있는" 방식 (In-context Memory)

    • 비유: 친구와 대화할 때, 처음부터 지금까지의 대화 내용 전체를 다시 한 번 읽어보며 다음 말을 잇는 상황입니다.
    • 문제점: 대화가 길어질수록 (예: 여행 계획 3 일 차, 10 일 차) 입에 물고 있는 내용이 너무 많아져서 머리가 아파지고 (비용 증가), 중요한 내용을 놓치기 쉽습니다. 또한, 대화의 길이가 제한되어 있어 더 이상 기억할 수 없게 됩니다.
  • 방법 B: "무질서한 책상 서랍" 방식 (Flat RAG)

    • 비유: 모든 대화 내용을 하나의 거대한 책상 서랍에 쑤셔 넣은 뒤, 필요한 것을 찾을 때 키워드만 보고 끄집어내는 방식입니다.
    • 문제점: 구조가 없어서 맥락을 잃습니다. 예를 들어, "3 일 차 회의가 꽉 찬 날에 커피 브레이크를 추가해 줘"라고 요청하면, AI 는 '회의'라는 단어만 보고 **틀린 날 (예: 1 일 차)**의 회의 내용을 가져와서 엉뚱한 곳에 커피 브레이크를 넣을 수 있습니다.

2. 해결책: "시맨틱 XPath" (Semantic XPath) 🌳

이 논문이 제안한 시맨틱 XPath는 AI 의 기억을 **정리된 나무 구조 (트리)**로 바꾸고, 정교한 검색 도구를 사용하는 방식입니다.

🌲 비유: "정리된 도서관과 전문 사서"

이 시스템은 AI 의 기억을 층층이 정리된 도서관으로 바꿉니다.

  • 나무 구조 (Tree Structure): 여행 계획이라면 여행 → 날짜 → 일정 → 장소처럼 계층적으로 정리되어 있습니다.
  • XPath (검색 언어): "3 일 차 중 회의가 가장 많은 날"이라는 복잡한 요청을, 도서관 사서가 정확한 위치 (날짜) 를 찾아내고, 그 안의 세부 내용 (회의) 을 분석하여 가장 적합한 장소를 골라내는 것처럼 작동합니다.

✨ 핵심 기능: "의미 있는 검색"

기존의 XPath 는 정확한 글자만 찾았지만, **시맨틱 (Semantic)**이 붙으면서 의미까지 이해합니다.

  • 예시: "회의가 꽉 찬 날"이라고 하면, AI 는 단순히 '회의'라는 글자가 많은 날이 아니라, 그날의 일정 내용 전체를 분석해서 회의 비중이 가장 높은 날을 찾아냅니다.

3. 왜 이 방법이 더 좋은가요? 🚀

논문의 실험 결과를 비유로 풀어보면 다음과 같습니다.

  1. 성능이 압도적으로 좋습니다 (176.7% 향상)

    • 비유: 무질서한 책상 서랍 (Flat RAG) 에서 물건을 찾는 것보다, 정리된 도서관에서 전문 사서가 찾아주는 것이 훨씬 정확합니다. 특히 복잡한 작업 (여행 계획, 할 일 목록) 에서 실수가 훨씬 적습니다.
  2. 비용과 시간이 획기적으로 줄어듭니다 (토큰 사용량 9.1% 수준)

    • 비유: 모든 대화 내용을 다시 읽는 방식 (In-context) 은 매번 도서관 전체를 다시 훑어보는 것과 같습니다. 하지만 시맨틱 XPath 는 필요한 책장 한 줄만 정확히 가져옵니다.
    • 결과: 같은 일을 처리하는 데 드는 비용 (토큰) 이 기존 방식의 약 10 분의 1밖에 들지 않습니다.
  3. 오래된 대화도 잘 기억합니다 (멀티턴 대화)

    • 비유: 대화가 100 번 이상 이어져도, AI 는 중요한 부분만 기억하고 나머지는 깔끔하게 정리해 둡니다. 그래서 대화 길이가 길어질수록 성능이 떨어지지 않고 일정하게 유지됩니다.

4. 실제 시스템: "시맨틱 XPath 챗" 💬

저희는 이 기술을 실제로 보여주는 데모 시스템도 만들었습니다.

  • 사용자: "회의가 많은 날에 커피 브레이크를 추가해 줘."
  • AI 의 시각화:
    1. 메모리 뷰: 나무 구조로 정리된 여행 일정을 보여줍니다.
    2. 실행 뷰: AI 가 어떻게 "회의가 많은 날"을 계산하고, 2 일 차를 선택했는지, 어떤 점수를 매겼는지 단계별로 보여줍니다.
    • 마치 AI 가 생각하는 과정을 투명하게 보여주는 X-레이 같은 기능입니다.

📝 한 줄 요약

"AI 가 복잡한 일을 오랫동안 도와줄 때, 모든 대화를 다시 읽거나 무질서하게 검색하는 대신, 정리된 나무 구조에서 '의미'를 이해하며 필요한 부분만 정확히 찾아내는 새로운 기억 시스템을 만들었습니다."

이 기술은 앞으로 여행 계획, 할 일 관리, 레시피 추천 등 오래 지속되고 복잡한 작업을 수행하는 AI 비서의 핵심 기술이 될 것으로 기대됩니다.