Causal Neural Probabilistic Circuits

이 논문은 개념 간 인과 관계를 고려하여 개입 시 정확도를 향상시키기 위해 신경 속성 예측기와 인과 확률 회로를 결합한 '인과 신경 확률 회로 (CNPC)'를 제안하고, 이를 통해 다양한 개입 조건에서 기존 모델보다 높은 성능을 입증합니다.

Weixin Chen, Han Zhao

게시일 2026-03-03
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

1. 문제: "잘못된 추측을 고치면, 나머지는 그대로일까?"

비유: 의사와 환자의 관계
생각해 보세요. 환자가 병원에 왔는데, AI 가 "이 환자는 흡연자이고 폐암일 확률이 높다"고 진단했다고 가정해 봅시다.
그런데 의사가 "잠깐, 이 환자는 흡연자가 아니야"라고 AI 의 추측을 바로잡아 줍니다 (이걸 '개입'이라고 합니다).

  • 기존 AI (CBM) 의 방식:
    기존 모델은 AI 가 "흡연자"라고 잘못 말한 부분만 "아니야, 비흡연자야"라고 고치고, 나머지 부분은 "그대로" 둡니다.
    • 문제점: 현실에서 "흡연자가 아니다"라고 고치면, 자연스럽게 "폐암일 확률"도 줄어들어야 합니다. 하지만 기존 모델은 "흡연자"라는 사실만 바꿨을 뿐, 그로 인해 "폐암" 확률이 어떻게 변해야 하는지 **인과관계 (원인과 결과)**를 고려하지 않아서 여전히 높은 확률을 유지할 수 있습니다. 마치 "날씨가 맑다"고 잘못 예보했다가 "비"로 고쳐주었는데, "우산 필요함" 여부는 여전히 '필요함'으로 고정해 둔 것과 같습니다.

2. 해결책: CNPC (인과 관계 지도를 가진 AI)

저자들은 이 문제를 해결하기 위해 CNPC라는 모델을 만들었습니다. 이 모델은 두 가지 친구가 협력하는 구조입니다.

  • 친구 A (신경망): "눈이 빠른 감지기"
    • 사람의 눈으로 사진을 보고 "저건 빨간색이야", "저건 웃고 있어" 같은 특징을 빠르게 찾아냅니다. 하지만 가끔 실수할 수 있습니다.
  • 친구 B (인과 회로): "논리적인 지도책"
    • 이 친구는 **인과 관계 지도 (Causal Graph)**를 가지고 있습니다. "흡연자 → 폐암", "웃음 → 매력"처럼 어떤 특징이 어떤 결과를 만드는지 논리적으로 연결된 지도를 외우고 있습니다.

CNPC 의 작동 방식 (PoE: 전문가들의 합의)
전문가 (의사) 가 "흡연자가 아니야"라고 수정해 주면:

  1. 친구 A는 "아, 내가 잘못 봤네. 수정된 정보를 받아들일게."라고 합니다.
  2. 친구 B는 "그렇다면 지도에 따르면, 흡연자가 아니면 폐암 확률도 자연스럽게 낮아져야 해"라고 계산합니다.
  3. CNPC는 이 두 친구의 의견을 적절히 섞어서 (PoE, 전문가들의 합의) 최종 진단을 내립니다.

이때 중요한 점은, **친구 B(지도책)**가 "흡연자가 바뀌면 폐암 확률도 자동으로 변한다"는 인과 관계를 정확히 계산해 준다는 것입니다.

3. 왜 이 모델이 특별한가요? (실험 결과)

논문은 이 모델이 여러 상황에서 얼마나 잘 작동하는지 실험했습니다.

  • 평범한 상황 (Benign Setting):
    • AI 가 원래 잘하는 상황에서는 기존 모델들과 비슷하게 잘합니다.
  • 예상치 못한 상황 (Out-of-Distribution):
    • 상황: 사진을 180 도 뒤집거나, 해커가 이미지를 살짝 변조해서 AI 가 혼란스러워하는 경우.
    • 결과: 이때는 AI(친구 A) 가 완전히 망가져서 "이게 무슨 그림인지 모르겠다"며 엉뚱한 특징을 찾아냅니다.
    • CNPC 의 활약: 이때는 **친구 B(인과 지도책)**의 역할이 빛을 발합니다. AI 가 엉뚱한 말을 해도, "논리적으로 그럴 리가 없지"라고 지도책을 통해 교정해 주기 때문에, 전문가가 몇 가지 사실만 고쳐주면 전체 진단이 훨씬 정확하게 바뀝니다.

4. 핵심 요약

  • 기존 모델: "실수한 부분만 고쳐줘. 나머지는 알아서 해." (인과관계를 무시함)
  • CNPC: "실수한 부분을 고쳐주면, 그 영향이 다른 부분까지 어떻게 퍼져나갈지 논리 지도를 통해 계산해서 함께 고쳐줘." (인과관계를 존중함)

결론적으로, CNPC 는 인공지능이 실수했을 때 전문가의 도움을 받아 더 빠르고 정확하게 다시 일어설 수 있게 해주는, 논리적이고 유연한 새로운 AI입니다. 특히 AI 가 처음 본 낯선 상황 (예: 변형된 이미지) 에서 실수를 할 때, 이 모델이 가장 빛을 발합니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →