Scalable Contrastive Causal Discovery under Unknown Soft Interventions

이 논문은 단일 관찰 및 간섭 regimes 에서 알려지지 않은 부드러운 간섭을 처리하여 확장 가능한 인과적 발견을 가능하게 하는 새로운 모델을 제안하고, 이론적 증명과 실험을 통해 기존 방법보다 향상된 인과 구조 복원 성능과 일반화 능력을 입증합니다.

Mingxuan Zhang, Khushi Desai, Sopho Kevlishvili, Elham Azizi

게시일 2026-03-05
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

1. 문제 상황: "미스터리한 사건"과 "완벽하지 않은 증거"

인과관계를 찾는 것은 마치 형사가 사건을 해결하는 것과 같습니다.

  • 관측 데이터 (Observational Data): 형사가 현장에 가서 사람들이 어떻게 행동하는지 지켜보는 것입니다. 하지만 사람들은 서로 영향을 주고받기 때문에, A 가 B 를 만났다고 해서 A 가 B 를 만든 건지, 아니면 B 가 A 를 만났는지, 혹은 C 가 둘 다 부른 건지 알기 어렵습니다. (이걸 통계학에서는 'Markov 동등성 클래스'라고 하는데, 쉽게 말해 **"정답이 여러 개일 수 있는 상태"**입니다.)
  • 개입 (Intervention): 형사가 직접 개입해서 "A 를 강제로 움직여봐!"라고 시키는 것입니다. 보통은 "어떤 버튼을 누르면 A 가 움직인다"는 것을 정확히 알고 있어야 하지만, 현실에서는 "누가 버튼을 눌렀는지 모르고, 버튼도 완전히 작동하지 않는 (Soft Intervention)" 경우가 많습니다.

기존의 문제점:

  1. 정확한 개입 정보가 없음: "누가 개입했는지"도 모르고, 개입이 완벽하지도 않습니다.
  2. 데이터가 부족함: 보통 한 가지 상황 (예: 평상시) 과 한 가지 개입 상황 (예: 실험실) 만 주어집니다.
  3. 규모의 문제: 변수 (사람) 가 수백 명, 수천 명이면 기존 방법들은 계산이 너무 복잡해져서 멈춰버립니다.

2. SCONE 의 해결책: "두 명의 탐정"과 "비교 분석"

SCONE 는 이 문제를 해결하기 위해 **두 가지 상황을 비교 (Contrast)**하는 방식을 사용합니다.

비유: "평범한 날"과 "축제 날"의 마을

가정해 봅시다. 어떤 마을 (데이터) 이 있습니다.

  • 상황 1 (관측): 평범한 날, 마을 사람들이 어떻게 움직이는지 봅니다.
  • 상황 2 (개입): 마을 어딘가에 **정체를 알 수 없는 축제 (Soft Intervention)**가 열렸습니다. 사람들은 평소와 다르게 움직이지만, 정확히 누구를 대상으로 축제가 열렸는지는 모릅니다.

SCONE 는 이 두 상황을 동시에 분석합니다.

핵심 전략 1: 작은 팀으로 나누어 조사 (Subset-level)
전체 마을을 한 번에 분석하면 너무 복잡합니다. SCONE 는 마을을 작은 구역 (Subset) 으로 나누어 각 구역별로 "누가 누구를 따라다니는지"를 먼저 파악합니다. 마치 소규모 탐정 팀을 보내는 것과 같습니다.

핵심 전략 2: "무엇이 달라졌는지" 비교하기 (Contrastive Rules)
이게 SCONE 의 가장 큰 특징입니다.

  • 규칙 1 (한쪽만 변함): A 와 B 가 평소에는 서로를 따라다녔는데, 축제 날에는 B 만 갑자기 다른 행동을 합니다. A 는 그대로라면? A 가 B 를 이끄는 것이 아니라, B 가 외부의 영향 (축제) 을 받아 변한 것일 가능성이 큽니다. 이걸로 방향을 정합니다.
  • 규칙 2 (삼각형 구조): A, B, C 세 사람이 있습니다. 평소에는 A-B-C 순서로 이어져 있었는데, 축제 날 B 만이 A 와 C 모두에게서 영향을 받으며 변했습니다. 이는 **B 가 A 와 C 의 '결합점 (V-structure)'**일 확률이 높다는 뜻입니다.

이처럼 **"평범한 날"과 "축제 날"의 차이점 (Contrast)**을 분석함으로써, 기존 방법으로는 알 수 없었던 인과관계의 방향을 찾아냅니다.

핵심 전략 3: 전체 그림으로 합치기 (Global Aggregation)
작은 구역별로 찾은 단서들을 **중앙 지휘본부 (Axial Attention)**로 보내서, 전체 마을의 지도를 완성합니다. 이 지휘본부는 모든 단서를 연결하여 모순이 없는 하나의 거대한 인과 지도를 그립니다.


3. 왜 이것이 혁신적인가?

  1. 알 수 없는 변수도 해결: "누가 버튼을 눌렀는지"를 몰라도, 데이터의 변화 패턴을 비교하면 누가 영향을 받았는지 추론할 수 있습니다. (마치 범인의 얼굴을 보지 않아도, 범행 현장의 흔적만으로 범인을 특정하는 것과 같습니다.)
  2. 대규모 데이터 처리: 작은 팀 (서브셋) 으로 나누어 계산하기 때문에, 변수가 100 개, 200 개가 되어도 빠르게 작동합니다. 기존 방법들은 50 개만 되어도 멈춰버리는 경우가 많았습니다.
  3. 새로운 상황에도 적응: 훈련할 때 본 적 없는 종류의 데이터 (예: 전혀 다른 문화권의 마을) 가 와도, "비교 분석"이라는 원리를 적용하면 잘 적응합니다.

4. 요약: 한 줄로 정리하면?

"SCONE 는 두 가지 다른 상황 (평범한 날과 변화가 있는 날) 에서의 데이터를 작은 조각으로 나누어 비교하고, 그 차이점을 분석하여 '누가 누구를 움직였는지'를 정확히 찾아내는, 빠르고 똑똑한 인과관계 탐정입니다."

이 기술은 의학 (어떤 약이 어떤 유전자를 자극하는지), 경제 (정책이 시장에 미치는 영향), 기후 변화 연구 등 복잡한 시스템을 이해하는 데 큰 도움을 줄 것으로 기대됩니다.