Scaling DPPs for RAG: Density Meets Diversity

이 논문은 RAG 시스템의 검색 결과 중복 문제를 해결하고 정보 밀도와 다양성을 동시에 최적화하기 위해, 경량 P-Adapter 와 Diverse Margin Loss 를 활용한 확장 가능한 DPP 기반 메커니즘인 'ScalDPP'를 제안하고 그 우수성을 실험적으로 입증합니다.

Xun Sun, Baiheng Xie, Li Huang, Qiang Gao

게시일 2026-04-07
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🍽️ 1. 기존 방식의 문제: "같은 맛의 요리만 잔뜩"

상황:
사용자가 AI 에게 질문을 하면, AI 는 외부 지식 (책이나 문서) 을 찾아서 답을 만듭니다. 이를 **RAG(검색 증강 생성)**라고 합니다.

기존 방식의 비유:
질문을 했을 때, AI 는 도서관에서 질문과 가장 비슷한 책 10 권을 뽑아옵니다.

  • 문제점: 질문이 "애플의 CEO 는 누구인가?"라면, AI 는 '애플 CEO', '팀 쿡', '애플 최고경영자'라는 제목의 거의 똑같은 내용의 책 10 권을 뽑아올 수 있습니다.
  • 결과: AI 의 머릿속 (메모리) 공간은 이 중복된 정보로 꽉 차게 됩니다. 중요한 다른 정보 (예: "그가 왜 사임했는가?", "어떤 업적을 남겼는가?") 를 담을 공간이 부족해져서, AI 는 **중복된 정보만 반복하거나 중요한 사실을 놓치는 실수 (할루시네이션)**를 저지릅니다.

🌟 2. 이 논문의 해결책: "ScalDPP(스칼 DPP)"

이 논문은 **"비슷한 것만 모으지 말고, 서로 다른 정보를 골고루 모으자"**라고 제안합니다. 이를 위해 **DPP(결정적 점 과정)**라는 수학적 도구를 사용했습니다.

비유: "다양한 재료를 섞은 영양 만점 스프"

  • 기존 방식: 같은 감자만 10 개 넣은 스프. (비슷한 정보만 모음)
  • 이 논문의 방식 (ScalDPP): 감자, 당근, 양파, 소금 등 서로 다른 재료를 골라 넣어서 스프를 만듭니다.
    • 핵심: 질문과 관련된 정보 (맛) 는 유지하되, 서로 겹치지 않는 다양한 정보 (영양) 를 함께 모아서 AI 가 더 풍부한 맥락에서 답을 만들게 합니다.

🛠️ 3. 어떻게 구현했나요? (세 가지 핵심 기술)

이 논문의 방법론은 세 가지 부품으로 이루어져 있습니다.

  1. P-Adapter (스마트 필터):

    • 기존에 검색된 책들 (정보) 에 붙이는 작은 '스마트 태그' 같은 것입니다.
    • 이 태그는 책들이 서로 얼마나 다르거나 보완적인지를 계산해서, 비슷한 책끼리는 거리를 두고, 서로 다른 책끼리는 가까이 오도록 재배치합니다.
  2. 동적 커널 (실시간 선택):

    • 도서관 전체를 미리 계산할 필요 없이, 질문이 들어오자마자 지금 필요한 책들만 실시간으로 분석해서 가장 좋은 조합을 골라냅니다. (확장성 확보)
  3. 다양한 마진 손실 (DML) - "교육 방법":

    • AI 를 훈련시킬 때, "중복된 책 10 권을 고르면 감점, 서로 다른 책 3 권을 골라 조합하면 점수 UP"이라고 가르치는 새로운 규칙입니다.
    • 기존 방식은 단순히 '비슷한 것'을 찾는 데만 집중했지만, 이 방법은 **'서로 다른 것들의 조합'**이 얼마나 중요한지 학습시킵니다.

📊 4. 실제 효과는 어땠나요?

실험 결과, 이 방법을 쓰면 다음과 같은 변화가 있었습니다:

  • 복잡한 질문 해결: "A 가 B 를 만났고, B 가 C 를 만났을 때 A 와 C 의 관계는?"처럼 여러 단계를 거쳐야 하는 질문 (Multi-hop) 에서 훨씬 정확한 답을 냈습니다.
  • 중복 제거: 같은 내용을 반복하는 문서 대신, 서로 다른 관점의 문서를 골라내어 AI 가 더 넓은 시야를 갖게 했습니다.
  • 속도: 무거운 계산을 하지 않고도 가볍게 작동하여 속도가 느려지지 않았습니다.

💡 요약

이 논문은 **"AI 가 정보를 찾을 때, '가장 비슷한 것'만 쫓지 말고, '서로 다른 정보'를 골고루 섞어서 모으는 지능적인 방법"**을 개발했습니다.

마치 요리사가 같은 재료만 잔뜩 사 오는 대신, 다양한 재료를 골라 완벽한 요리를 만드는 것처럼, AI 가 더 정확하고 풍부한 답변을 할 수 있도록 돕는 혁신적인 기술입니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →