DataFactory: Collaborative Multi-Agent Framework for Advanced Table Question Answering

이 논문은 기존 대규모 언어 모델의 한계를 극복하고 복잡한 테이블 질의응답의 정확성을 획기적으로 향상시키기 위해, 데이터 리더와 전문 에이전트 팀 간의 협업 및 자동화된 지식 그래프 변환을 가능하게 하는 'DataFactory'라는 다중 에이전트 프레임워크를 제안합니다.

Tong Wang, Chi Jin, Yongkang Chen, Huan Deng, Xiaohui Kuang, Gang Zhao

게시일 Wed, 11 Ma
📖 4 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 'DataFactory(데이터 공장)' 라는 이름의 새로운 인공지능 시스템을 소개합니다. 이 시스템은 우리가 복잡한 표 (Table) 형태의 데이터를 가지고 질문을 할 때, 기존 AI 들이 겪는 실수나 한계를 해결하기 위해 고안된 '협력하는 팀' 방식입니다.

기존의 AI 는 혼자서 모든 일을 하려고 하다가 큰 표를 보면 기억력이 부족해지거나 (맥락 길이 제한), 없는 사실을 지어내거나 (할루시네이션), 복잡한 논리를 따라가지 못하는 문제가 있었습니다. DataFactory 는 이 문제를 "전문가 팀을 꾸려서 함께 일하게 함" 으로 해결합니다.

이 시스템을 쉽게 이해할 수 있도록 한국의 전통적인 '장인 (공방) 팀' 에 비유해 설명해 드리겠습니다.


🏭 DataFactory: 지혜로운 데이터 공장

이 시스템은 혼자 일하는 '혼자 하는 장인'이 아니라, 세 명의 전문가가 모여 일하는 공방과 같습니다.

1. 팀의 구성원 (세 명의 전문가)

  • 👑 데이터 리더 (Data Leader): "현명한 공장장"

    • 역할: 사용자의 질문을 듣고, 어떤 전문가를 불러야 할지 지시합니다.
    • 비유: 마치 식당의 마ître(메이트)공장장과 같습니다. 손님이 "오늘의 메뉴를 추천해 줘"라고 하면, 그는 "오늘은 생선이 좋으니 수석 요리사 (DB 팀) 에게 물어보고, 가격 비교는 계산 담당 (KG 팀) 에게 확인하자"라고 지시합니다.
    • 특징: 단순히 명령만 내리는 게 아니라, "생각 (Thought) → 행동 (Action) → 관찰 (Observation)" 과정을 반복하며 상황에 맞춰 전략을 바꿉니다. (이를 ReAct 패러다임이라고 합니다.)
  • 📊 데이터베이스 팀 (Database Team): "정밀한 계산사"

    • 역할: 숫자, 합계, 정렬, 필터링 등 숫자 계산과 구조화된 데이터를 다룹니다.
    • 비유: 회계사정밀한 저울을 다루는 장인입니다. "지난달 매출이 얼마였나요?" 같은 질문에는 이 팀이 SQL(데이터 검색 언어) 을 써서 정확한 숫자를 찾아냅니다.
    • 강점: 숫자 계산과 대량 데이터 처리에 매우 정확합니다.
  • 🕸️ 지식 그래프 팀 (Knowledge Graph Team): "연결의 마법사"

    • 역할: 데이터 사이의 숨겨진 관계복잡한 연결고리를 찾아냅니다.
    • 비유: 친구 관계망을 분석하는 탐정이나 지도를 그리는 지도 제작자입니다. "A 가 B 를 소개했고, B 는 C 와 같은 학교를 다녔다"처럼, 표에 직접 적혀 있지 않은 간접적인 관계를 찾아냅니다.
    • 강점: "누가 누구를 통해 알았는지" 같은 복잡한 2 단계, 3 단계 추론 (Multi-hop reasoning) 에 탁월합니다.

2. 어떻게 일하나요? (자연스러운 대화)

기존 시스템은 "A 를 하고, 그다음 B 를 하고, 그다음 C 를 한다"라는 고정된 명령서대로만 움직였습니다. 하지만 DataFactory 는 자연스러운 대화로 일합니다.

  • 상황: 사용자가 "세계 청소년 선수권 대회에서 어떤 이벤트들이 있었는지, 그리고 각 이벤트의 세부 종목 코드는 무엇인지 알려줘"라고 물었습니다.
  • 공장장의 지시:
    1. 공장장: "수석 계산사 (DB 팀) 에게 먼저 대회 이벤트 목록을 찾아오라고 해."
    2. 계산사: "네, 목록을 찾았습니다. (이벤트 A, B, C...)"
    3. 공장장: "좋아. 이제 연결의 마법사 (KG 팀) 에게 이 이벤트들의 세부 종목 코드가 무엇인지 찾아오라고 해."
    4. 마법사: "네, 이벤트 A 는 '수영', B 는 '육상'입니다."
    5. 공장장: "두 팀의 정보를 합쳐서 사용자에게 정리된 답을 줘."

이처럼 자연어 (말) 로 서로 의견을 나누고, 중간에 결과가 안 좋으면 다시 계획을 수정하는 유연한 협업이 가능합니다.

3. 왜 이 방식이 더 좋을까요? (기존 방식과의 차이)

  • 할루시네이션 (거짓말) 감소:
    • 비유: 혼자 일하는 AI 는 기억력이 나빠서 "아마도 그랬을 거야"라고 지어내는 경우가 많았습니다. 하지만 DataFactory 는 실제 데이터 (DB)관계도 (KG) 를 직접 검색해서 답을 만들기 때문에, 거짓말을 할 확률이 훨씬 낮습니다.
  • 복잡한 문제 해결:
    • 비유: 혼자서 모든 일을 하려다 지쳐서 실패하는 대신, 계산은 계산사에게, 관계 분석은 탐정에게 맡기니 복잡한 문제도 척척 해결합니다.
  • 정확도 향상:
    • 실험 결과, 기존 방법보다 약 20%~24% 더 정확한 답을 내놓았습니다. 특히 "A 를 통해 B 를 알면 C 는?" 같은 복잡한 추론 문제에서 효과가 큽니다.

4. 실제 활용 (플랫폼)

이 시스템은 단순히 이론이 아니라, 실제로 웹사이트에서 사용할 수 있는 플랫폼으로 만들어졌습니다.

  • 사용자가 복잡한 질문을 하면, 시스템이 자동으로 데이터를 분석하고, 그래프 (연결도)차트로 시각화해 줍니다.
  • 데이터 분석 전문가가 아니어도, 일상적인 말로 질문하면 전문가 팀이 대신 분석해 주는 것입니다.

💡 한 줄 요약

"DataFactory 는 혼자서 모든 걸 하다가 지치는 AI 대신, '계산 전문가'와 '관계 분석 전문가'를 부르는 '현명한 공장장'을 두어, 복잡한 데이터 질문을 정확하고 신뢰할 수 있게 해결해주는 협력 시스템입니다."

이 방식은 기업이 방대한 데이터를 분석할 때나, 우리가 복잡한 정보를 찾아야 할 때 AI 의 실수를 줄이고 더 똑똑한 도움을 받을 수 있게 해줍니다.