Rule Extraction in Machine Learning: Chat Incremental Pattern Constructor

이 논문은 불투명한 예측 행동을 인간이 읽을 수 있는 기호 구조로 변환하는 해석 가능한 기계 학습의 핵심 문제인 규칙 추출을 위해, 토큰 그래프 기반의 경량 증분 기호 학습 시스템인 Chat Incremental Pattern Constructor(ChatIPC) 를 제안하고 그 수학적 형식화와 알고리즘적 명료성을 제시합니다.

Caleb Princewill Nwokocha

게시일 2026-03-20
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"ChatIPC(챗 인크리멘탈 패턴 컨스트럭터)"**라는 아주 독특하고 투명한 인공지능 시스템을 소개합니다.

일반적인 AI(예: 최신 챗봇) 가 마치 "마법 상자"처럼 어떻게 답을 내는지 알 수 없는 반면, 이 시스템은 완전히 눈에 보이는 규칙으로만 작동합니다. 복잡한 수학적 모델 대신, 단어들의 연결고리를 하나하나 쌓아 올리는 방식을 사용하죠.

이 복잡한 논문을 일반인이 이해하기 쉽게, 세 가지 핵심 비유로 설명해 드릴게요.


1. 핵심 아이디어: "단어들의 레고 블록" (규칙 추출)

일반적인 AI 는 수천억 개의 숫자 파라미터를 학습해서 "어떤 단어가 나올 확률이 높은지"를 계산합니다. 하지만 ChatIPC 는 다릅니다.

  • 비유: imagine you are building a wall with bricks.
    • 일반 AI: 벽돌을 쌓는 순간, 벽돌이 어떻게 붙었는지 기억하지 않고 "어디에 벽돌이 있을 것 같은지" 감으로 맞춥니다. (블랙박스)
    • ChatIPC: "A 라는 벽돌 다음에는 반드시 B 라는 벽돌이 온다"는 명확한 규칙을 메모장에 적어둡니다.
    • 작동 원리: 사람이 "안녕하세요"라고 말하면, 시스템은 "안녕하세요" 다음에 "반갑습니다"가 온다는 사실을 **규칙 (A → B)**으로 저장합니다. 이 규칙들이 모여 거대한 지도가 됩니다.

이 시스템은 처음부터 복잡한 수학을 배우는 게 아니라, 사람이 쓴 글을 보고 "다음에 뭐가 올까?"라는 연결고리를 하나씩 발견해 나갑니다.

2. 두 가지 마법 도구: "사전을 활용한 확장"과 "유사도 점수"

단순히 "다음 단어"만 기억하면 답이 너무 단순해집니다. 그래서 ChatIPC 는 두 가지 지능적인 장치를 씁니다.

A. 사전을 활용한 확장 (Definition Expansion) = "연상 작용"

  • 상황: 시스템이 "사과"라는 단어를 만났을 때, 단순히 "사과" 다음에 오는 단어만 기억하면 부족합니다.
  • ChatIPC 의 방법: "사과"라는 단어를 사전을 찾아보고, 사과의 정의에 나오는 단어들 (예: '빨강', '달콤', '과일', '나무') 을 모두 메모장에 추가합니다.
  • 비유: 마치 친구의 친구를 소개받듯이 작동합니다. "사과"를 말하면, 시스템은 "아, 사과는 빨간색이고 과일이지!"라고 생각하며 관련 단어들을 미리 준비해 둡니다. 이렇게 하면 문맥을 더 넓게 이해할 수 있습니다.

B. 유사도 점수 (Jaccard Similarity) = "가장 잘 맞는 친구 고르기"

  • 상황: 이제 다음 단어를 고를 때입니다. "사과" 다음에 "빨강", "나무", "과일" 중 무엇이 올까요?
  • ChatIPC 의 방법:
    1. 지금까지의 대화 내용 (프롬프트) 과 이미 쓴 답변을 모두 모읍니다.
    2. 후보 단어들이 가진 '연상 단어들'과 현재 대화 내용을 비교합니다.
    3. 공통점이 가장 많은 단어를 선택합니다. (이걸 '자카드 유사도'라고 합니다.)
  • 비유: 파티에서 새로운 친구를 소개받을 때, "내가 좋아하는 취향 (현재 대화) 과 가장 비슷한 취향 (후보 단어) 을 가진 사람을 고르는" 것과 같습니다.

3. 반복 방지: "지루한 루프 탈출"

  • 문제: AI 가 같은 말을 계속 반복하면 ("안녕... 안녕... 안녕...") 지루해집니다.
  • 해결: ChatIPC 는 "방금 쓴 단어"를 기억했다가, 그 단어가 너무 자주 나오면 점수를 깎아줍니다.
  • 비유: 대화할 때 같은 말을 반복하는 사람은 싫어하죠? 시스템도 "이 단어는 방금 썼으니, 다른 단어를 골라야 해!"라고 스스로 제재를 가합니다.

왜 이 시스템이 특별한가요? (장점과 한계)

✅ 장점: "투명한 블랙박스"

  • 왜? 이 시스템은 "왜 이 단어를 선택했는지"를 100% 설명할 수 있습니다.
    • "A 단어를 선택한 이유는, A 와 현재 대화 내용이 80% 겹치고, B 단어보다 반복 횟수가 적기 때문입니다."
  • 용도: 의료, 법률, 금융처럼 실수가 허용되지 않고 이유를 설명해야 하는 분야에 아주 유용합니다.

⚠️ 한계: "깊은 이해 부족"

  • 왜? 이 시스템은 단어의 '의미'를 깊이 이해하지는 못합니다. 단순히 사전 정의와 연결고리만 봅니다.
  • 결과: 매우 복잡한 추론이나 유머, 감성적인 표현에는 약할 수 있습니다. 하지만 간단하고 명확한 정보 전달에는 아주 강력합니다.

한 줄 요약

"ChatIPC 는 AI 가 복잡한 수학을 외우는 게 아니라, 단어와 단어 사이의 연결고리를 '레고 블록'처럼 하나하나 쌓아올려, 누구나 그 과정을 볼 수 있고 이해할 수 있는 투명한 대화 시스템을 만든 것입니다."

이 논문은 "인공지능이 어떻게 작동하는지 알려면, 복잡한 신경망 대신 간단하고 투명한 규칙을 사용하는 방법도 있다"는 것을 보여줍니다.