Graphs RAG at Scale: Beyond Retrieval-Augmented Generation With Labeled Property Graphs and Resource Description Framework for Complex and Unknown Search Spaces

Each language version is independently generated for its own context, not a direct translation.

📖 핵심 비유: "도서관 사서 vs. 지도를 가진 탐험가"

이 논문의 핵심은 **기존 RAG(검색 증강 생성)**와 새로운 Graph RAG의 차이를 설명하는 데 있습니다.

1. 기존 방식 (기존 RAG): "혼란스러운 도서관의 사서"

기존 AI 는 사용자의 질문을 받으면, 방대한 문서 더미 속에서 유사한 단어를 찾아냅니다.

비유: 마치 거대한 도서관에서 "사과"에 대해 물어보면, '사과'라는 단어가 포함된 모든 책 (사과 파이 레시피, 사과 농장 이야기, 사과에 대한 과학 논문 등) 을 무작위로 뽑아내는 사서와 같습니다.
문제점:
- 정확도 부족: 비슷한 단어가 있어도 실제 의미는 다를 수 있습니다. (예: "애플"이라는 회사가 궁금한데, 과일 관련 책만 줌)
- 무작위성: 몇 권의 책을 찾아야 할지 미리 정하기 어렵습니다. 너무 적으면 정보가 부족하고, 너무 많으면 소음 (Noise) 이 섞여 AI 가 헷갈립니다.
- 구조 없는 데이터: 표나 JSON 같은 정돈된 데이터도 그냥 글자 덩어리로 취급해서 관계를 놓칩니다.

2. 새로운 방식 (Graph RAG): "정교한 지도를 가진 탐험가"

이 논문은 데이터를 단순한 글자가 아니라, **노드 (점) 와 엣지 (선) 로 연결된 거대한 지도 (그래프)**로 만들자고 제안합니다.

비유: 이제 AI 는 도서관 사서가 아니라, **정밀한 지하철 노선도 (지도)**를 가진 탐험가가 됩니다.
- 노드 (역): 'AMCAP 펀드', 'S&P 500 지수', '포트폴리오 매니저' 같은 개념들입니다.
- 엣지 (선로): 이 개념들을 연결하는 관계들입니다. (예: "AMCAP 펀드" --(투자함)--> "S&P 500")
장점:
- 관계 파악: "AMCAP 펀드를 관리하는 사람은 누구인가?"라고 물으면, 단순히 '관리자'라는 단어가 있는 책을 찾는 게 아니라, 노선도를 따라 직접 연결된 역으로 이동해 정확한 답을 찾습니다.
- 미지의 공간도 탐색: 어떤 질문이 들어와도, 미리 정해진 문서 개수 (K) 에 구애받지 않고 관계망을 따라 필요한 정보만 정확히 찾아옵니다.

🛠️ 이 논문이 제안한 두 가지 주요 기술 (두 가지 지도 방식)

저자들은 이 '지식 지도'를 만드는 두 가지 방법을 실험했습니다.

1. RDF 방식 (Resource Description Framework)

비유: "세 가지 조각 퍼즐 (주어 - 서술어 - 목적어)"
- 모든 정보를 (주제, 관계, 내용)이라는 3 단 퍼즐 조각으로 쪼개서 저장합니다.
- 예: (AMCAP 펀드, 벤치마크, S&P 500)
- 특징: 매우 유연하고 표준화되어 있지만, 질문을 퍼즐 조각으로 변환하는 과정이 다소 복잡할 수 있습니다.

2. LPG 방식 (Labeled Property Graph) - 가장 성공적인 방법

비유: "정교하게 설계된 지하철 노선도"
- 단순히 퍼즐 조각을 쌓는 게 아니라, 역 (노드) 의 종류와 선로 (관계) 의 이름을 미리 명확하게 정의합니다.
- 예: '펀드'라는 역, '투자'라는 선로, '매니저'라는 역 등 **스키마 (지도 설계도)**를 꼼꼼하게 그립니다.
- 특징: 질문을 받아서 바로 "어떤 역으로 이동해야 하는지"를 **Cypher(지도 읽는 언어)**로 변환해 실행합니다.
- 결과: 이 방식이 가장 정확하고 빠릅니다. 특히 복잡한 질문 (예: "S&P 500 에 투자하는 모든 펀드의 매니저를 찾아줘") 에 대해 기존 방식보다 훨씬 뛰어난 성능을 보였습니다.

📊 실험 결과: 왜 그래프가 더 좋은가?

저자들은 자본 그룹 (Capital Group) 의 실제 금융 데이터 (1,104 개의 펀드 정보) 를 가지고 실험했습니다.

기존 방식 (텍스트 검색): "어떤 펀드가 S&P 500 에 투자하나요?"라고 물으면, 관련 문서를 10 개나 20 개나 뽑아내야 하는데, 그중에서 정답을 찾기 어렵거나 중요한 정보를 놓치는 경우가 많았습니다.
그래프 방식 (LPG): 같은 질문을 하면, 지도를 따라 직접 연결된 경로를 따라가므로 정확도 90% 이상의 답변을 실시간으로 내놓았습니다.
- 특히 **"비교 (Compare)"**나 **"상세 정보 (Detail)"**를 요구하는 복잡한 질문에서 기존 방식보다 압도적으로 잘했습니다.

💡 결론: "질문할 때, '문서'를 찾는 게 아니라 '관계'를 찾아라"

이 논문의 핵심 메시지는 다음과 같습니다:

"AI 가 똑똑해지려면, 방대한 책을 더 많이 읽게 하는 것 (데이터 양 증가) 보다, 정보들 사이의 연결고리 (관계) 를 명확하게 그려주는 것이 훨씬 중요합니다."

기존의 AI 는 단어를 찾아 헤매지만, 이 논문이 제안한 Graph RAG는 의미와 관계를 따라가서 답을 찾습니다. 특히 금융, 의료, 법률처럼 정확한 사실 관계가 중요한 분야에서는 이 방식이 기존 기술을 완전히 대체할 수 있는 차세대 기술임을 증명했습니다.

한 줄 요약:

"AI 에게 책 더미를 주는 대신, 정교한 지도를 주면 훨씬 똑똑하고 정확한 답을 얻을 수 있다!"

Each language version is independently generated for its own context, not a direct translation.

1. 문제 정의 (Problem)

기존의 검색 증강 생성 (RAG) 시스템은 주로 비정형 텍스트에 대한 밀집 벡터 임베딩 (Dense Vector Embedding) 과 유사성 검색에 의존합니다. 그러나 Capital Group 의 사례와 같이 반정형 (Semi-structured) 또는 구조화된 데이터 (예: 중첩된 JSON, 키 - 값 쌍) 를 다루거나, 검색 공간이 불명확한 (Unknown Search Space) 복잡한 시나리오에서는 다음과 같은 한계가 존재합니다.

검색 공간의 불확실성: 검색할 문서의 수를 사전에 지정하기 어렵습니다. 문서 수 ( $K$ ) 를 너무 작게 설정하면 핵심 정보를 놓치고, 너무 크게 설정하면 노이즈가 증가하여 할루시네이션 (Hallucination) 이 발생할 위험이 커집니다.
재순위화 (Reranking) 의 비효율성: 기존 파이프라인은 임베딩과 재순위화 모델에 의존하여 관련 문서를 선별하는데, 이는 병목 현상을 초래하고 복잡한 관계 추론에는 한계가 있습니다.
데이터 표현의 한계: 단순 텍스트 변환은 중첩된 JSON 구조의 계층적 관계와 엔티티 간의 복잡한 연결성을 왜곡하거나 손실시킵니다.

2. 제안된 방법론 (Methodology)

저자들은 라벨드 속성 그래프 (LPG) 와 자원 기술 프레임워크 (RDF) 아키텍처를 활용한 엔드 - 투 - 엔드 Graph RAG 프레임워크를 제안합니다. 데이터는 Capital Group 의 1,104 개 펀드 (상호펀드, ETF 등) 에 대한 중첩된 JSON 데이터셋을 기반으로 합니다.

A. 데이터 표현 및 변환

RDF (Resource Description Framework):
- 각 JSON 객체를 고유한 subject (펀드 약칭), predicate (속성 키), object (속성 값) 의 트리플 (Triplet) 로 변환합니다.
- 중첩된 JSON 구조를 재귀적으로 처리하여 계층적 관계까지 트리플로 매핑합니다.
- Amazon Neptune 에 저장되며, SPARQL 쿼리 언어를 사용하여 탐색합니다.
LPG (Labeled Property Graph):
- JSON 데이터를 노드 (엔티티) 와 엣지 (관계), 속성 (Properties) 을 가진 그래프로 모델링합니다.
- 스키마 설계: 펀드, 펀드 유형, 벤치마크 등을 별도의 노드로 정의하고, 명시적인 관계 (예: HAS_PRODUCT_TYPE) 로 연결하여 다중 홉 (Multi-hop) 탐색을 최적화합니다.
- Text-to-Cypher: LLM 을 활용하여 자연어 질문을 실행 가능한 Cypher 쿼리로 실시간 변환합니다. 이를 위해 그래프 스키마, 구조, 메타데이터를 프롬프트에 주입하여 정확도를 높였습니다.

B. 파이프라인 구성

RDF 파이프라인: 사용자 쿼리 기반의 노드 선택 (LLM + 결정론적 매핑) 과 관계 선택 (임베딩 기반 + LLM 기반 분류) 을 수행한 후, SPARQL 을 통해 관련 트리플을 추출하여 생성 모델에 입력합니다.
LPG 파이프라인: Text-to-Cypher 모듈이 사용자의 자연어 질문을 그래프 스키마를 반영한 Cypher 쿼리로 변환하고, 이를 실행하여 정확한 컨텍스트를 추출합니다.
대조군 (Agentic RAG): JSON 을 비정형 텍스트로 변환 (RAG1) 하거나, 임베딩 기반 검색과 재순위화 (RAG2) 를 적용한 기존 방식과 비교합니다.

3. 주요 기여 (Key Contributions)

새로운 Graph RAG 프레임워크: 반정형 JSON 데이터를 RDF 와 LPG 아키텍처로 변환하여 동적이고 확장 가능한 검색 증강 생성을 가능하게 하는 엔드 - 투 - 엔드 시스템을 제안했습니다.
실시간 Text-to-Cypher 변환: 그래프 스키마와 메타데이터를 프롬프트에 통합하여 자연어 쿼리를 Cypher 로 90% 이상의 정확도로 실시간 변환하는 모듈을 개발했습니다.
예측 불가능한 검색 공간 해결: 문서 수를 사전에 지정할 필요가 없으며, 재순위화 (Reranking) 없이도 효율적인 검색이 가능한 구조를 입증했습니다.
포괄적인 실증 분석: RDF, LPG 기반 Graph RAG 와 기존 임베딩 기반 RAG 를 다양한 쿼리 의도 (검색, 비교, 상세 정보 등) 에 대해 정량적으로 비교 평가했습니다.

4. 실험 결과 (Results)

200 개의 다양한 질문 (검색, 비교, 상세, 기타) 에 대한 평가 결과, Graph RAG (LPG 및 RDF) 가 기존 Agentic RAG 를 압도적으로 능가했습니다.

전체 점수 (200 점 만점):
- LPG 기반 Graph RAG: 185.5 점 (최고 성능)
- RDF 기반 Graph RAG: 172.5 점
- Agentic RAG (기존 방식): 116 점
쿼리 의도별 성능:
- 검색/목록 (Search/Listing): LPG 가 93/100 점으로 압도적 우위를 보였습니다. (RDF: 80 점, Agentic: 38.5 점)
- 비교 (Compare) 및 상세 (Detail): LPG 와 RDF 모두 40 점 이상 (45 점 만점) 을 기록하며 높은 정확도를 보였으나, Agentic RAG 는 35 점 대에 머물렀습니다.
성공 요인:
- LPG: 명확한 스키마 설계와 다중 홉 탐색 (Multi-hop traversal) 을 통해 복잡한 쿼리 (예: "특정 포트폴리오 매니저가 관리하는 모든 펀드") 에 대해 결정론적이고 효율적인 탐색이 가능했습니다.
- RDF: 트리플 기반의 명시적 관계 매핑이 유용했으나, 노드/관계 선택 오류 가능성이 LPG 보다 약간 높았습니다.
- Agentic RAG 의 실패 원인: 검색 공간이 불확실할 때 적절한 문서 수 ( $K$ ) 설정의 어려움, 임베딩 모델의 미세한 구분 실패 (예: 유사한 펀드 코드 혼동), 그리고 재순위화의 한계로 인해 성능이 저하되었습니다.

5. 의의 및 결론 (Significance & Conclusion)

구조화된 데이터 처리의 혁신: 대규모, 중첩된 JSON 데이터와 같은 반정형 데이터를 처리할 때, 그래프 기반 접근법 (특히 LPG) 이 기존 임베딩 기반 RAG 보다 정확성, 응답 품질, 추론 능력 면에서 월등히 우수함을 입증했습니다.
확장성: 문서 수를 미리 정의할 필요가 없는 Graph RAG 는 검색 공간이 불명확하거나 동적인 환경 (금융, 의료 등) 에서 더욱 신뢰할 수 있는 솔루션입니다.
미래 전망: 본 연구는 그래프 데이터베이스 (Amazon Neptune 등) 와 LLM 의 결합이 차세대 RAG 시스템의 표준이 될 수 있음을 시사하며, 특히 복잡한 관계 추론이 필요한 도메인에서 Graph RAG 가 필수적임을 강조합니다.

이 논문은 단순한 텍스트 검색을 넘어, 데이터의 구조와 관계를 이해하는 그래프 기반 RAG가 복잡한 지식 작업 (Knowledge-intensive tasks) 에서 필수적인 기술임을 명확히 보여줍니다.