Conformal Graph Prediction with Z-Gromov Wasserstein Distances

이 논문은 그래프 출력에 대한 분포 없는 커버리지 보장을 제공하기 위해 Z-그로모프-워터스테인 거리를 비동일성 척도로 정의하고, 복잡한 출력 공간을 처리할 수 있는 적응형 예측 집합을 생성하는 새로운 정합 예측 프레임워크를 제안합니다.

Gabriel Melo, Thibaut de Saivre, Anna Calissano, Florence d'Alché-Buc

게시일 2026-03-06
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

1. 문제 상황: "정답은 하나인데, 답안지는 여러 개일 수 있다?"

Imagine you are a detective trying to identify a suspect based on a blurry photo (input).

  • 기존 방식: AI 가 "범인은 김철수입니다!"라고 단정적으로 말합니다. 하지만 김철수가 범인이 아닐 수도 있는데, AI 는 그 가능성을 알려주지 않습니다.
  • 이 연구의 목표: "범인은 김철수일 가능성이 90% 이상입니다. 만약 김철수가 아니라면, 이 3 명의 다른 용의자 중 하나일 겁니다"라고 **확실한 범위 (Set)**를 제시하고 싶었습니다.

하지만 여기서 큰 문제가 생깁니다. 범인은 **사람 (단순한 객체)**이 아니라 **분자 (복잡한 구조)**입니다.

  • 분자 A 와 분자 B 는 원자 배열이 똑같지만, 원자들의 이름 (레이블) 만 바뀌어 있을 수 있습니다. (예: 왼쪽에 있는 탄소와 오른쪽에 있는 탄소를 바꿔도 같은 분자입니다.)
  • 기존 AI 는 "이게 정답이고 저게 오답이야"라고 딱 잘라 말하지만, 구조는 같는데 이름만 다른 경우를 구별하지 못해 엉뚱한 불확실성을 계산할 수 있습니다.

2. 해결책 1: "거울 속의 그림자"를 비교하는 자 (Z-Gromov-Wasserstein 거리)

이 연구는 **"Z-Gromov-Wasserstein (Z-GW)"**이라는 새로운 자를 고안했습니다.

  • 비유: 두 개의 복잡한 퍼즐 (그래프) 을 비교한다고 상상해 보세요.
    • 기존 자는 "퍼즐 조각 1 번이 A 위치, 2 번이 B 위치"라고 딱 맞춰야만 같다고 봅니다.
    • **이 연구의 자 (Z-GW)**는 "조각들의 관계가 똑같은가?"를 봅니다. "A 가 B 옆에 있고, B 가 C 위에 있는 구조"가 같다면, 조각의 번호가 바뀌어도 똑같은 퍼즐로 인정합니다.
    • 마치 거울에 비친 그림자를 비교하듯, 구조적 본질만 보고 거리를 재는 것입니다. 이를 통해 AI 가 예측한 분자와 실제 분자가 '구조적으로 얼마나 비슷한지'를 정확히 측정할 수 있게 됩니다.

3. 해결책 2: "상황에 맞는 안전벨트" (SCQR)

기존의 불확실성 측정법은 모든 상황에 똑같은 크기의 안전벨트를 채워줍니다.

  • "어떤 질문이든 정답을 찾을 확률이 90% 이면, 답을 5 개씩 줘라"라고 합니다.
  • 하지만 쉬운 질문에는 5 개가 너무 많고 (비효율적), 어려운 질문에는 5 개가 너무 적어 정답을 놓칠 수 있습니다.

이 연구는 **SCQR (점수 기반 적응형 양자 회귀)**이라는 기술을 도입했습니다.

  • 비유: 상황에 따라 길이가 조절되는 스마트 안전벨트입니다.
    • 쉬운 질문 (명확한 분자 스펙트럼): "이건 확실히 A 분자야!" → 안전벨트를 짧게 조여 답을 1~2 개만 줍니다. (정확도 유지하면서 효율 극대화)
    • 어려운 질문 (모호한 스펙트럼): "이건 A 일 수도 있고 B 일 수도 있어..." → 안전벨트를 길게 풀어 답을 10~20 개 줍니다. (정답을 놓치지 않도록 보호)
  • 이렇게 입력 데이터의 난이도에 따라 예측 범위를 적응적으로 조절합니다.

4. 실제 실험: "분자 찾기 게임"

연구진은 이 방법을 두 가지 게임에 적용해 보았습니다.

  1. 합성 게임 (그림에서 그래프 맞추기): 그림을 보고 어떤 색으로 칠해진 그래프가 나올지 예측하는 게임.
    • 결과: 안전벨트 (예측 집합) 를 상황에 맞게 조절하니, 정답을 놓치지 않으면서도 불필요한 후보를 줄일 수 있었습니다.
  2. 실제 게임 (질량 분석기로 분자 찾기): 화학 물질의 스펙트럼 (지문 같은 것) 을 보고 어떤 분자인지 맞추는 게임.
    • 결과: 기존 방식은 정답을 찾을 확률은 높았지만, 후보 목록이 너무 길어서 (평균 24 개) 실용적이지 않았습니다.
    • 이 연구의 방식 (SCQR): 난이도에 따라 후보 목록을 평균 15 개로 줄이면서도 정답을 찾을 확률 (90% 이상) 은 유지했습니다. 마치 "너무 많은 용의자 목록을 정밀하게 필터링해서 핵심 용의자만 남긴 것"과 같습니다.

5. 요약: 이 연구가 왜 중요한가?

이 논문은 **"복잡한 구조 (그래프) 를 예측할 때, AI 가 '내가 얼마나 확신하는지'를 정직하게 알려주는 방법"**을 제시했습니다.

  • 구조를 무시하지 않음: 분자나 네트워크처럼 이름이 바뀌어도 같은 것을 구별해냅니다.
  • 유연함: 쉬운 문제는 간결하게, 어려운 문제는 넓게 예측하여 실용성을 높였습니다.
  • 신뢰성: "이 예측은 90% 확률로 정답을 포함한다"는 수학적 보장을 제공합니다.

결국, 이 기술은 화학, 의료, 물리학 등 고가의 실험이 필요한 분야에서 AI 의 예측을 신뢰하고, 불필요한 실험을 줄이는 데 큰 도움을 줄 것입니다.