Neuro-Symbolic Learning for Predictive Process Monitoring via Two-Stage Logic Tensor Networks with Rule Pruning

이 논문은 예측 프로세스 모니터링의 정확도와 규제 준수를 향상시키기 위해 도메인 지식을 통합하고, 데이터 학습 우선순위 설정 및 규칙 가지치기를 포함한 2 단계 최적화 전략을 적용한 신경-상징적 학습 프레임워크를 제안합니다.

Fabrizio De Santis, Gyunam Park, Francesco Zanichelli

게시일 2026-03-31
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🏥 배경: 왜 새로운 방법이 필요할까요?

지금까지 병원이나 은행 같은 곳에서 업무를 예측할 때 AI 는 주로 **과거의 기록 (데이터)**만 보고 학습했습니다. 마치 "지난 10 년간 환자들이 어떻게 치료받았는지"만 보고 미래를 예측하는 거죠.

하지만 여기서 큰 문제가 생깁니다.

  • 데이터의 함정: 과거 데이터에는 "실수"나 "예외 상황"이 섞여 있을 수 있습니다.
  • 규칙의 중요성: 하지만 현실 세계에는 반드시 지켜야 할 절대적인 규칙이 있습니다.
    • 예시: "수술을 받기 전에 반드시 7 일 이상 입원해야 한다"거나, "환자 신원 확인이 끝나기 전에 돈을 이체하면 안 된다"는 식이죠.

기존 AI 는 과거 데이터에서 "수술 전 입원이 짧았던 경우"를 많이 봤다면, "아, 입원이 짧아도 수술 가능한구나"라고 잘못 학습할 수 있습니다. 하지만 실제로는 그건 위반 행위일 뿐이죠.

💡 해결책: "수석 의사 (AI)"에게 "규칙책 (논리)"을 입히다

이 논문은 **뉴로-심볼릭 (Neuro-Symbolic)**이라는 방법을 제안합니다. 쉽게 말해, **데이터를 배우는 AI(신경망)**와 **규칙을 지키는 논리 (상징적 AI)**를 한 몸으로 합친 것입니다.

이를 위해 **LTN(Logic Tensor Networks)**이라는 도구를 사용하는데, 마치 AI 가 규칙책을 읽으면서 학습하게 만드는 거예요.

🛠️ 핵심 기술: "두 단계 학습 전략" (The Two-Stage Strategy)

여기서 가장 중요한 부분이 나옵니다. 단순히 규칙책을 AI 에게 주면, AI 가 규칙만 맹목적으로 따르다가 실제 예측 능력을 잃어버리는 실수를 저지를 수 있습니다. (예: "수술 전 입원 7 일"이라는 규칙만 지키려고, 모든 환자를 7 일 입원시킨다고 예측하는 식이죠. 이건 예측이 아니라 규칙 반복입니다.)

저자들은 이 문제를 해결하기 위해 두 단계로 나누어 학습시키는 clever 한 방법을 고안했습니다.

1 단계: "데이터 먼저, 규칙은 보조" (가중치 학습)

  • 상황: AI 가 처음 공부를 시작할 때입니다.
  • 방법: AI 에게 "일단 과거 데이터 (환자 기록) 를 잘 분석해"라고 먼저 시킵니다. 규칙책은 참고만 하도록 합니다.
  • 비유: 의대생이 먼저 임상 경험을 쌓고, 그다음에 교과서 (규칙) 를 보며 교정하는 과정입니다. 이렇게 하면 AI 가 데이터의 흐름을 먼저 잡습니다.

2 단계: "쓸모없는 규칙은 버려라" (규칙 다듬기/Rule Pruning)

  • 상황: AI 가 어느 정도 데이터를 이해했으니, 이제 규칙책을 정리할 때입니다.
  • 문제: 규칙책에는 쓸모없는 것, 혹은 데이터와 충돌하는 엉뚱한 규칙들이 섞여 있을 수 있습니다.
  • 방법: AI 가 학습하면서 "이 규칙은 실제로 도움이 되는가?"를 체크합니다.
    • 도움이 되는 규칙: 유지 (예: "수술 후 2 시간 이내 항생제 투여는 필수")
    • 방해가 되는 규칙: 삭제 (예: "데이터와 맞지 않는 엉뚱한 조건")
  • 결과: AI 는 이제 데이터도 잘 알고, 중요한 규칙만 정확히 지키는 똑똑한 전문가가 됩니다.

📊 실험 결과: 왜 이 방법이 좋은가요?

저자들은 실제 병원 데이터 (Sepsis, BPIC 등) 로 실험을 해보았습니다.

  1. 데이터가 부족할 때: 과거 기록이 적은 경우, 기존 AI 는 엉뚱한 예측을 했지만, 이 방법은 규칙을 통해 정확한 예측을 했습니다. (규칙이 데이터의 빈 공간을 채워줍니다.)
  2. 규칙 위반이 중요한 경우: "반드시 지켜야 할 법규"가 있는 상황에서는 기존 AI 는 규칙을 무시하고 예측했지만, 이 방법은 규칙을 지키면서도 높은 정확도를 냈습니다.
  3. 가장 중요한 발견: 규칙을 그냥 무작정 넣으면 (2 단계 없이) 오히려 AI 성능이 폭망했습니다. 하지만 두 단계 전략을 쓰면 성능이 비약적으로 향상되었습니다.

🎁 한 줄 요약

"과거의 데이터 (경험) 와 미래의 규칙 (법칙) 을 모두 잘 활용하게 하려면, AI 가 먼저 경험을 쌓게 한 뒤, 쓸모있는 규칙만 골라내어 가르쳐야 합니다."

이 논문은 인공지능이 단순히 "데이터만 보고 추측"하는 수준을 넘어, 현실 세계의 법칙과 윤리를 준수하면서도 정확한 예측을 할 수 있게 해주는 중요한 발걸음입니다.