DeepSieve: Information Sieving via LLM-as-a-Knowledge-Router

이 논문은 복잡한 질의를 구조화된 하위 질문으로 분해하고 LLM 을 지식 라우터로 활용하여 다단계 정제 과정을 통해 관련 정보를 선별하는 에이전트 기반 RAG 프레임워크인 'DeepSieve'를 제안하며, 이를 통해 기존 방식보다 향상된 추론 깊이와 검색 정밀도를 달성함을 보여줍니다.

Minghao Guo, Qingcheng Zeng, Xujiang Zhao, Yanchi Liu, Wenchao Yu, Mengnan Du, Haifeng Chen, Wei Cheng

게시일 2026-03-03
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

DeepSieve: 지식을 걸러내는 똑똑한 '정보 사수'

이 논문은 인공지능 (LLM) 이 복잡한 질문에 답할 때 겪는 어려움을 해결하기 위해 제안된 새로운 방법, DeepSieve에 대해 설명합니다.

간단히 말해, DeepSieve 는 **"질문을 잘게 쪼개고, 필요한 정보를 찾아내는 전문가에게만 맡기는 똑똑한 정보 필터"**입니다.


🧐 왜 이런 게 필요할까요? (문제 상황)

지금까지의 인공지능 (LLM) 은 책을 많이 읽어서 지식이 풍부하지만, 최신 정보비밀스러운 회사 데이터 같은 특정 분야 지식이 부족할 때가 많습니다.

기존의 해결책 (RAG) 은 "질문이 오면 관련 문서를 뒤져서 답을 찾아라"라는 방식이었습니다. 하지만 이 방식에는 두 가지 큰 문제가 있었습니다:

  1. 질문이 너무 복잡할 때: "에릭 호트의 출생지가 속한 나라는?" 같은 질문은 "에릭 호트 → 출생지 (몬테벨로) → 몬테벨로가 속한 주 → 그 주는 어느 나라?"라는 여러 단계를 거쳐야 합니다. 기존 방식은 이걸 한 번에 해결하려다 헷갈리거나 엉뚱한 답을 내놓습니다.
  2. 정보 출처가 너무 다양할 때: 회사 내부는 'SQL 데이터베이스', 인터넷은 '위키백과', 개인 메모는 '텍스트 파일'처럼 저장 방식이 다릅니다. 기존 방식은 이 모든 것을 뒤섞어서 뒤지기 때문에, 개인 정보 유출이나 형식 충돌 같은 문제가 생기고, 불필요한 정보까지 섞여 답이 흐려집니다.

비유하자면:
기존 방식은 한 명의 요리사에게 "오늘 저녁 메뉴를 만들어줘. 재료는 냉장고 (개인 데이터), 마트 (인터넷), 그리고 우리 농장 (회사 DB) 에서 다 가져와서 섞어줘"라고 시키는 것과 같습니다. 요리사는 혼란스러워하고, 엉뚱한 재료를 섞거나, 중요한 재료를 놓칠 수 있습니다.


🛠️ DeepSieve 는 어떻게 해결하나요? (해결책)

DeepSieve 는 이 문제를 해결하기 위해 4 단계의 정교한 과정을 거칩니다.

1 단계: 질문을 쪼개기 (Decomposition)

복잡한 질문을 **작은 조각 (하위 질문)**으로 나눕니다.

  • 비유: 큰 피자를 한 입 크기로 잘라내는 작업입니다. "에릭 호트의 나라를 찾아줘"라는 큰 질문을 "에릭 호트 출생지는?", "몬테벨로는 어디?", "몬테벨로는 어떤 나라?"로 쪼갭니다.

2 단계: 정보 사수 (Routing) - 핵심 기술

각 작은 질문을 가장 적합한 정보 출처로 보냅니다.

  • 비유: 이제 각 조각을 가장 잘 아는 전문가에게 보냅니다.
    • "에릭 호트 출생지는?" → 회사 인사 DB (비밀 정보)
    • "몬테벨로는 어디?" → 위키백과 (일반 지식)
    • "몬테벨로가 속한 나라는?" → 지도 API
    • LLM 이 '지식 라우터' 역할을 하여, 어떤 질문은 내부 DB 에, 어떤 질문은 인터넷에 보내는 것입니다. 이렇게 하면 불필요한 정보 섞임을 막고, 프라이버시도 보호됩니다.

3 단계: 실패하면 다시 생각하기 (Reflexion)

만약 찾은 정보가 엉뚱하거나 부족하면, 스스로 반성하고 다시 시도합니다.

  • 비유: 요리사가 "아, 이 재료가 아니었구나!"라고 깨닫고, 다른 전문가에게 다시 물어보는 것입니다. "에릭 호트"를 찾지 못하면 "에릭"이 아니라 "에릭 호트"로 다시 검색하거나, 다른 DB 를 찾아봅니다.

4 단계: 답을 합치기 (Fusion)

모든 작은 조각의 답을 모아서 하나의 완벽한 답을 만듭니다.

  • 비유: 각 전문가가 가져온 재료를 요리사가 다시 한 번 맛보고, 최종 요리를 완성합니다.

🌟 DeepSieve 의 장점

  1. 정확도 UP: 질문을 쪼개고 올바른 출처로 보내기 때문에, 엉뚱한 답 (할루시네이션) 을 줄이고 정확한 답을 냅니다.
  2. 비용 절감: 모든 정보를 다 뒤지는 게 아니라, 필요한 곳만 딱딱 찾아오기 때문에 계산 비용 (토큰 사용량) 이 훨씬 적게 듭니다.
  3. 유연성: 회사 DB, 위키, API 등 어떤 형태의 정보든 연결할 수 있습니다. 마치 레고 블록처럼 필요한 도구를 끼워 넣을 수 있습니다.
  4. 투명성: 왜 이 답이 나왔는지, 어떤 과정을 거쳤는지 단계별로 볼 수 있어 신뢰도가 높습니다.

📊 결론

DeepSieve 는 인공지능이 복잡한 질문에 답할 때, 혼자서 모든 것을 해결하려 하지 않고, 질문을 잘게 나누어 각 분야의 전문가에게 맡기는 '스마트한 관리자' 역할을 합니다.

이 방법은 인공지능이 더 똑똑하고, 빠르며, 신뢰할 수 있는 파트너가 되도록 도와주는 혁신적인 기술입니다. 마치 가장 능숙한 비서가 boss 의 복잡한 업무를 각 부서 전문가에게 적절히 배정하고, 결과를 정리해서 보고하는 것과 같습니다.