Elenchus: Generating Knowledge Bases from Prover-Skeptic Dialogues

이 논문은 대형 언어 모델을 화자 (Prover) 와 반박자 (Skeptic) 로 활용하여 전문가와의 대화를 통해 지식을 추출하는 것이 아니라 명시화하는 'Elenchus' 시스템을 제안하고, 이를 비단조 다결 (NMMS) 논리에 매핑하여 W3C PROV-O 온톨로지의 설계 근거를 대화에서 추출하고 형식적으로 검증하는 방법을 제시합니다.

Bradley P. Allen

게시일 Tue, 10 Ma
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

1. 기존의 방식 vs. 새로운 방식 (엘렌쿠스)

🚫 기존 방식: "녹음기" (Extraction)
전통적인 지식 공학은 전문가를 녹음기처럼 생각했습니다.

  • 상황: 전문가가 머릿속에 완벽한 지식 구조를 가지고 있다고 가정합니다.
  • 작업: 연구자가 전문가에게 "이건 뭐죠? 저건 뭐죠?"라고 물어보고, 그 대답을 그대로 적어내면 끝입니다.
  • 문제점: 실제로 전문가의 머릿속 지식은 흐릿하고, 상황에 따라 달라집니다. 녹음기로는 그 흐릿한 부분을 다 잡아낼 수 없기 때문에, 지식을 정리하는 데 항상 병목 현상이 생깁니다.

✅ 새로운 방식 (엘렌쿠스): "토론 동아리" (Explicitation)
저자는 지식이 미리 완성된 보물상자가 아니라, 대화 속에서 만들어지는 것이라고 봅니다.

  • 상황: 전문가와 AI 가 토론 동아리를 만듭니다.
  • 작업:
    • 전문가 (Prover): "나는 A 라는 사실을 믿어."라고 주장합니다.
    • AI (Skeptic/의심쟁이): "잠깐, A 라고 믿으면서 B 는 부정하는 건 모순이 아닌가요?"라고 질문합니다.
    • 해결: 전문가는 이 모순을 발견하고, 자신의 주장을 수정하거나, "아, 내가 B 는 부정할 수 없구나"라고 깨닫습니다.
  • 결과: 이 과정에서 전문가가 진짜로 믿고 방어할 수 있는 지식이 드러나고, 그것이 지식 베이스가 됩니다.

2. 엘렌쿠스가 어떻게 작동할까요? (비유: 건축가 vs. 검사관)

이 시스템은 **건축가 (전문가)**와 **엄격한 검사관 (AI)**의 관계로 비유할 수 있습니다.

  1. 건축가가 설계도를 그립니다: 전문가가 어떤 주제에 대해 "이건 이렇게 돼야 해"라고 말합니다.
  2. 검사관이 구멍을 찾습니다: AI 는 "그런데 여기가 다른 부분과 충돌하지 않나요?"라고 지적합니다. (논리적 모순을 찾아내는 것)
  3. 건축가가 수정합니다: 전문가는 "아, 맞다. 그건 고쳐야겠다"라고 수정하거나, "아니, 그건 다른 조건이야"라고 설명합니다.
  4. 최종 설계도 완성: 이 과정을 반복하면, 모순 없이 단단하게 다져진 **최종 설계도 (지식 베이스)**가 나옵니다.

핵심 포인트: AI 는 지식을 가르쳐주는 선생님이 아니라, 전문가가 자신의 지식을 더 명확하게 만들도록 도와주는 '거울' 역할을 합니다. AI 가 틀린 말을 해도 전문가가 "아니야"라고 거절하면 되기 때문에, AI 가 실수해도 큰 문제가 없습니다.


3. 실제 사례: PROV-O (출처 추적)

이론만 말하면 어렵죠? 논문에서는 **W3C 의 PROV-O(출처 추적 표준)**라는 복잡한 규칙을 정리하는 실험을 했습니다.

  • 입력: 350 단어 정도의 짧은 문서만 AI 에게 줬습니다.
  • 과정: 전문가와 AI 가 대화하며 "이 규칙은 저 규칙과 충돌하지 않나요?"라고 7 번이나 질문하고 답을 찾았습니다.
  • 결과:
    • 전문가가 처음에는 "이 규칙은 모든 경우에 적용된다"고 생각했지만, 대화 중 "아, 아니야. 예외가 있구나"라고 깨달았습니다.
    • 이렇게 대화로 찾아낸 규칙들은, 나중에 수학적으로 검증했을 때, 실제로 해당 표준을 만들 때 전문가들이 8,820 통의 이메일과 152 회의 회의를 통해 고민했던 핵심 결정 사항들과 정확히 일치했습니다.

이는 짧은 대화 한 번으로, 수천 건의 문서 검토 없이도 핵심 지식을 정확히 뽑아낼 수 있음을 보여줍니다.


4. 왜 이것이 중요한가요? (논리적 구조의 비밀)

이 시스템이 만든 지식 베이스는 단순한 목록이 아니라, 논리적 규칙이 살아있는 구조입니다.

  • 비유: 레고 블록
    • 일반적인 지식 베이스는 레고 블록을 그냥 쌓아놓은 것 같습니다.
    • 엘렌쿠스의 지식 베이스는 **블록끼리 어떻게 연결되고, 어떤 블록은 함께 쓰면 무너지는지 (모순)**가 명확하게 정의된 상태입니다.
    • 예를 들어, "비가 오면 길이 젖는다"는 규칙이 있다면, "비가 오는데 길이 마른다"는 규칙은 자동으로 배제됩니다.
    • 더 중요한 건, 규칙이 항상 성립하는 게 아니라 상황에 따라 달라질 수 있다는 점을 인정합니다. (예: "비가 오면 길이 젖는다"는 일반적이지만, "지붕 아래라면 젖지 않는다"는 예외가 있을 수 있음). 이 시스템은 이런 유연한 규칙을 잘 처리합니다.

5. 요약: 한 문장으로 정리

엘렌쿠스는 "전문가가 머릿속에 있는 지식을 AI 가 빼내는 게 아니라, AI 가 전문가와 치열하게 토론하며 전문가 스스로가 지식을 더 명확하고 튼튼하게 다듬어 나가게 하는 시스템"입니다.

이 과정을 통해 만들어진 지식은 **어디서 유래했는지 (누가 언제 동의했는지)**가 모두 기록되어 있어, 신뢰할 수 있고, 컴퓨터가 논리적으로 추론할 수 있는 완벽한 형태가 됩니다. 마치 지식을 채굴 (Extraction) 하는 것이 아니라, 지식을 연마 (Explicitation) 하는 과정과 같습니다.