JANUS: Structured Bidirectional Generation for Guaranteed Constraints and Analytical Uncertainty

이 논문은 DAG 기반의 베이지안 결정 트리와 역위상 백필링 알고리즘을 통해 제약 조건을 100% 만족하면서도 기존 생성 모델의 정합성과 불확실성 추정 효율성을 동시에 확보하는 새로운 합성 데이터 생성 프레임워크 'JANUS'를 제안합니다.

Taha Racicot

게시일 2026-03-05
📖 4 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **'JANUS(야누스)'**라는 새로운 인공지능 시스템을 소개합니다. 이 시스템은 기존의 AI 가 가지고 있던 큰 고민을 해결해 줍니다.

쉽게 비유하자면, 기존 AI 는 **'정교하지만 통제 불가능한 마법사'**였습니다. 반면 JANUS 는 **'규칙을 완벽하게 지키는 똑똑한 요리사'**입니다.

이 내용을 일상적인 언어와 비유로 설명해 드리겠습니다.


1. 왜 JANUS 가 필요한가요? (4 가지 딜레마)

기존의 AI 는 데이터를 만들 때 보통 4 가지 중 2 가지만 잘 할 수 있었습니다.

  1. 진짜 같은 데이터 (정확도): 실제 데이터와 너무 비슷하게 만들어야 합니다.
  2. 규칙 준수 (통제): "연봉은 5 천만 원 이상이어야 한다", "나이보다 경력은 짧아야 한다" 같은 복잡한 규칙을 지켜야 합니다.
  3. 신뢰성 (불확실성): "이 데이터가 얼마나 확실한가?"를 알려줘야 합니다.
  4. 빠른 속도 (효율성): 너무 오래 걸리면 안 됩니다.

기존 기술들은 이 4 가지를 한 번에 다 해결하지 못했습니다.

  • CTGAN 같은 최신 AI: 진짜 같은 데이터는 잘 만들지만, "연봉 5 천만 원 이상" 같은 규칙을 지키려면 **수천 번을 시도하고 실패하는 방식 (거부 샘플링)**을 써서 매우 느립니다.
  • 기존 통계 모델: 규칙은 잘 지키지만, 데이터가 너무 복잡하면 진짜 같은 데이터를 못 만듭니다.

JANUS는 이 4 가지를 모두 해결했습니다.


2. JANUS 의 핵심 아이디어: "거꾸로 채우기" (Reverse-Topological Back-filling)

이게 JANUS 의 가장 멋진 부분입니다. 비유를 들어볼까요?

🏠 집 짓기 비유

  • 기존 AI (전진 방식):
    먼저地基 (기초) 를 놓고, 벽을 세우고, 지붕을 올립니다. 그런데 나중에 "아, 지붕이 너무 높으면 안 되네? 3 층으로 낮춰야겠다"라고 규칙을 깨닫습니다.
    이때는 다시 처음부터 지어야 합니다 (거부 샘플링). 100 번 시도해서 1 번만 맞으면 99 번은 버리는 꼴입니다.

  • JANUS (거꾸로 채우기):
    JANUS 는 "지붕이 3 층이어야 한다"는 규칙을 먼저 정합니다.
    그다음, "3 층 지붕을 받치려면 2 층 벽이 어떻게 생겼어야 하지?", "2 층 벽을 받치려면 1 층 기초가 어떻게 되어야 하지?"라고 규칙을 거꾸로 따라가며 기초부터 쌓습니다.
    결과적으로 **규칙을 위반할 가능성 자체가 0%**가 됩니다. 처음부터 규칙에 맞는 집을 짓는 것이니까요.

이 기술을 논문에서는 **'Reverse-Topological Back-filling(역위상 백필링)'**이라고 부릅니다. 규칙을 위반하는 시도를 아예 하지 않기 때문에 속도가 50 배 이상 빨라집니다.


3. 두 개의 얼굴을 가진 야누스 (Bidirectional Generation)

로마 신화의 '야누스'는 앞과 뒤를 동시에 보는 두 얼굴의 신입니다. JANUS 도 마찬가지입니다.

  1. 앞을 보는 눈 (Forward): "이 사람의 나이가 30 대라면, 보통 연봉은 얼마일까?"를 예측합니다. (일반적인 AI 기능)
  2. 뒤를 보는 눈 (Backward): "연봉이 1 억 원이라면, 이 사람의 나이는 보통 몇 살일까?"를 역으로 추론합니다.

기존 나무 (Decision Tree) 는 앞만 보지만, JANUS 는 나무의 잎사귀 하나하나에 '앞으로 가는 정보'와 '뒤로 가는 정보'를 모두 저장해 둡니다. 그래서 규칙을 거꾸로 적용할 때 아주 빠르고 정확하게 작동합니다.


4. "내가 얼마나 모르는지" 알려주는 능력 (불확실성 분석)

AI 가 데이터를 만들 때, "이건 진짜 데이터에서 나온 거야"라고 말하지만, 사실은 AI 가 모르는 영역일 수 있습니다.

  • 기존 AI: "모든 데이터가 똑같이 확실해"라고 말하거나, 확신을 주기 위해 10 번을 반복해서 계산해야 합니다 (시간 낭비).
  • JANUS: 한 번의 계산으로 두 가지 종류의 불확실성을 구별해 줍니다.
    • 데이터 자체의 소음 (Aleatoric): "아, 이 부분은 원래 데이터가 너무 복잡해서 정확히 알 수 없구나." (바꿀 수 없는 것)
    • AI 의 무지 (Epistemic): "아, 이 부분은 내가 배운 데이터가 부족해서 모르는 거구나." (더 배우면 해결됨)

이걸 수학 공식으로 바로 계산해 내기 때문에, 기존 방식보다 128 배나 빠릅니다. 마치 "이 지역은 비가 자주 와서 (데이터 소음) 우산이 필요하지만, 저 지역은 내가 지도를 안 봐서 (무지) 길을 잃을 수 있어"라고 정확히 알려주는 것과 같습니다.


5. 왜 이것이 중요한가요? (실생활 예시)

이 기술은 고위험 (High-stakes) 분야에서 특히 중요합니다.

  • 공정한 채용: "지원자의 연봉 제안은 요청 연봉보다 낮으면 안 된다"는 규칙을 AI 가 지킬 수 있습니다. 기존 AI 는 이 규칙을 지키기 위해 수천 번의 시도를 해야 했지만, JANUS 는 100% 정확히 지켜줍니다.
  • 편향성 테스트: "인종 차별이 있는 데이터"를 인위적으로 만들어서, "우리 회사의 채용 시스템이 이 차별을 찾아낼 수 있을까?"를 테스트할 수 있습니다. JANUS 는 어디에, 얼마나 편향성을 심었는지 정확히 알고 있기 때문에, AI 의 공정성을 검증하는 최고의 실험실 역할을 합니다.

요약: JANUS 가 가져온 변화

특징 기존 AI (CTGAN 등) JANUS (이 논문)
규칙 준수 규칙을 지키려면 수천 번 시도 (거부) 필요 거의 즉시 100% 준수 (거꾸로 채우기)
속도 규칙이 복잡할수록 지수함수적으로 느려짐 규칙이 복잡해도 일정하게 빠름
신뢰도 "이게 맞을까?"를 모음 "이 데이터는 내가 잘 모르는 부분이에요"라고 정확히 알림
비유 운전사: 길을 가다가 벽에 부딪히면 뒤로 후진해서 다시 출발 건축가: 벽이 있을 것을 미리 알고, 벽을 피해 설계도부터 그림

결론적으로, JANUS 는 AI 가 "블랙박스 (검은 상자)"가 아니라, 규칙을 철저히 지키고, 자신의 한계를 솔직하게 말해주는 신뢰할 수 있는 파트너로 만들어 줍니다. 이는 금융, 의료, 법률 등 실수가 허용되지 않는 분야에서 AI 를 안전하게 쓸 수 있는 길을 열어줍니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →