An Explainable and Interpretable Composite Indicator Based on Decision Rules

Each language version is independently generated for its own context, not a direct translation.

📊 1. 기존 방식 vs 새로운 방식: "블랙박스" 대 "유리 상자"

기존의 복합 지표 (Composite Indicators)

비유: 요리를 할 때, 모든 재료를 넣고 "맛있는 정도"를 계산하는 자동 요리 기계라고 생각해보세요.
문제점: 기계가 "이 요리는 85 점입니다!"라고 말해주지만, 어떤 재료가 얼마나 들어갔는지, 왜 그 점수가 나왔는지는 알려주지 않습니다. (블랙박스)
현실: 국가의 경쟁력, 의료 진단, 대학 순위 등을 매길 때, 여러 기준을 숫자로 합산해서 점수를 내는데, 그 과정이 복잡하고 투명하지 않아 사람들이 의심을 품곤 합니다.

이 논문이 제안하는 새로운 방식

비유: 이제 그 기계 대신 현명한 요리사가 옆에 서 있습니다. 요리사가 "이 요리는 85 점입니다. 왜냐하면 소금 (기준 A) 이 적당하고, 고기 (기준 B) 가 신선하기 때문입니다"라고 설명해 줍니다.
핵심: 복잡한 수식 대신 **"만약 (If) ~라면, 그러면 (Then) ~입니다"**라는 쉬운 규칙 (Decision Rules) 을 사용합니다.
- 예: "만약 학생의 수학 성적이 410 점 이상이고, 독해 성적이 470 점 이상이면, 최소 '우수 (H)' 등급에 해당합니다."

🛠️ 2. 어떻게 작동할까요? (4 가지 상황)

이 방법은 다양한 상황에서 유용하게 쓰입니다.

의사 결정의 이유 설명하기 (예: 뇌 손상 환자 진단)
- 상황: 의사가 환자의 눈을 뜨는 정도, 말하기, 몸 움직임을 점수화해서 '심각도'를 판단합니다.
- 새로운 방식: 단순히 점수 합만 보는 게 아니라, "눈이 통증에 반응하지 않고, 말이 이해할 수 없다면 심각 (Severe) 등급"이라는 규칙을 찾아냅니다. 새로운 환자가 오면 이 규칙을 적용해 "왜 이 환자가 심각한지" 쉽게 설명해 줍니다.
불투명한 점수를 해석하기 (예: 인간개발지수 HDI)
- 상황: 193 개 나라의 건강, 교육, 소득을 합쳐서 '인간개발지수'를 매깁니다. 하지만 이 계산 과정은 복잡해서 일반인이 이해하기 어렵습니다.
- 새로운 방식: "수명이 73 세 이상이고, 평균 schooling 년수가 12 년 이상이면 최고 등급 (Class 4)"이라는 규칙을 찾아냅니다. 복잡한 계산 없이, 어떤 나라가 왜 높은 등급을 받았는지 간단한 이유로 설명해 줍니다.
전문가의 의견을 규칙으로 만들기 (예: 주식 포트폴리오)
- 상황: 투자 전문가가 "이 주식은 '좋음', 저 주식은 '나쁨'으로 분류해 줘"라고 합니다.
- 새로운 방식: 전문가가 이미 분류해 둔 주식들을 분석해서, "수익률이 30% 이상이고, 이자율이 15% 이상이면 '매우 좋음'"이라는 규칙을 자동으로 찾아냅니다. 이제 새로운 주식이 들어와도 이 규칙으로 쉽게 평가할 수 있습니다.
기존 평가 방법의 결과 설명하기
- 상황: 이미 복잡한 알고리즘으로 점수가 매겨진 결과가 있습니다.
- 새로운 방식: 그 결과를 바탕으로 "왜 A 는 1 등이고 B 는 3 등인가?"에 대한 규칙을 역추적하여 설명해 줍니다.

🧩 3. 핵심 기술: "드러난 흠집"을 처리하는 방법

이 논문은 두 가지 중요한 문제를 해결합니다.

모순 없는 설명 (Consistency):
- 가끔 규칙이 충돌할 수 있습니다. "A 는 1 등 이상이어야 한다"는 규칙과 "A 는 3 등 이하여야 한다"는 규칙이 동시에 성립하면 모순이 생깁니다.
- 해결: 이 논문은 모순이 생기지 않는 규칙만 골라내는 알고리즘을 개발했습니다. 마치 퍼즐 조각을 맞춰서, 모든 조각이 서로 어긋남 없이 딱 들어맞도록 만드는 것입니다.
데이터가 빠졌을 때 (Missing Values):
- 상황: 설문조사에서 어떤 항목을 안 답했거나, 데이터가 누락된 경우가 많습니다. 보통은 이 데이터를 채워 넣거나 (Imputation) 아예 버립니다.
- 해결: 이 방법은 빠진 데이터가 있어도 규칙을 만들 수 있습니다.
  - 비유: "소금과 고기만 있으면 요리를 판단할 수 있다"는 규칙이 있다면, '양파' 데이터가 없어도 소금과 고기만 보고 판단할 수 있습니다. 빠진 부분은 규칙이 적용되지 않는다고 생각하면 되므로, 데이터를 임의로 채울 필요 없이 원래의 정보를 그대로 살립니다.

🌟 4. 왜 이것이 중요한가요?

이 논문이 제안하는 시스템은 **"투명성 (Transparency)"**과 **"책임 (Accountability)"**을 보장합니다.

이해하기 쉬움: 복잡한 수학을 몰라도, "A 조건과 B 조건을 만족했기 때문에 이 등급을 받았다"는 문장만 보면 누구나 이해할 수 있습니다.
공정성 검증: "왜 우리 회사는 점수가 낮았나요?"라고 물었을 때, "수익률과 직원 만족도가 기준보다 낮았기 때문입니다"라고 명확한 이유를 들이밀 수 있습니다.
신뢰도: "블랙박스"처럼 점수만 던져주는 게 아니라, 그 점수의 **이유 (Rationale)**를 제공하므로 사람들이 결과를 더 신뢰하게 됩니다.

💡 한 줄 요약

"복잡한 숫자 계산 대신, 누구나 이해할 수 있는 '만약 ~라면, ~입니다'라는 쉬운 규칙을 만들어, 평가 결과의 이유를 투명하게 설명해주는 새로운 방법입니다."

이 방법은 의료, 금융, 정책 평가 등 다양한 분야에서 의사결정의 투명성을 높이고, AI 시대에 필요한 '이해 가능한 설명 (Explainable AI)'을 실현하는 데 큰 기여를 할 것으로 기대됩니다.

Each language version is independently generated for its own context, not a direct translation.

1. 문제 제기 (Problem Statement)

기존 복합 지표의 한계: 복합 지표는 여러 기준 (criteria) 을 하나의 점수나 등급으로 집계할 때, 가중치 부여와 집계 방식 (보상적/비보상적) 에 대한 논란이 빈번합니다. 또한, 최종 점수가 어떻게 도출되었는지에 대한 명확한 설명이 부족하여 '블랙박스'로 간주되는 경우가 많습니다.
설명 가능성과 해석 가능성의 부재: 인공지능 (AI) 분야에서는 '사후 설명 (post-hoc explainability)'과 '사전 해석 (ante-hoc interpretability)'이 중요하게 논의되지만, 복합 지표 분야에서는 이러한 개념이 충분히 적용되지 않았습니다.
데이터의 불완전성: 실제 데이터에는 결측치 (missing values) 가 자주 발생하며, 기존 방법은 이를 처리하기 위해 임의의 대체 (imputation) 를 하거나 사례를 삭제하는 등 정보 왜곡의 위험이 있습니다.

2. 제안된 방법론 (Methodology)

논문은 **지배 기반 러프 집합 접근법 (Dominance-based Rough Set Approach, DRSA)**을 기반으로 한 결정 규칙 프레임워크를 제안합니다.

2.1 핵심 개념

결정 규칙 (Decision Rules): "만약 (If) ~ 조건을 만족하면, 그러면 (Then) ~ 등급에 속한다" 형태의 규칙을 생성합니다.
- At-least 규칙 ( $r^\ge$ ): 특정 기준들의 평가가 임계값 이상이면, 해당 단위 (unit) 는 적어도 특정 등급 이상에 속함.
- At-most 규칙 ( $r^\le$ ): 특정 기준들의 평가가 임계값 이하이면, 해당 단위는 적어도 특정 등급 이하에 속함.
DRSA 적용: 기존 러프 집합 이론을 MCDA 문제 (등급 분류) 에 확장한 DRSA 를 사용하여 규칙을 유도합니다. 이는 기준 간의 우세 관계 (dominance) 를 기반으로 합니다.

2.2 네 가지 시나리오

순서형 지표의 합에 대한 설명: 의료 점수 (예: 글래스고 혼수 척도) 처럼 숫자 코드를 단순히 합산하여 등급을 매긴 경우, 그 결과를 결정 규칙으로 설명.
불투명한 수치 지표의 해석: 인간개발지수 (HDI) 처럼 복잡한 수학적 공식을 통해 계산된 점수를 결정 규칙으로 역추적하여 설명.
의사결정자 (DM) 의 선호 기반 지표 구축: DM 이 참조 단위 (reference units) 에 부여한 등급을 바탕으로 새로운 복합 지표를 결정 규칙으로 구성 (Ante-hoc 접근).
기존 MCDA 방법 결과의 설명: ELECTRE-Score 등 기존 MCDA 방법으로 도출된 점수를 결정 규칙으로 설명.

2.3 알고리즘적 기여

최소 규칙 집합 유도 알고리즘: 기존 DRSA 알고리즘 (DOMLEM) 은 휴리스틱 방식이라 모든 최소 규칙을 보장하지 못했습니다. 본 논문은 **단일 실행으로 모든 최소 규칙을 유도하는 새로운 알고리즘 (Algorithm 1 & 2)**을 제안합니다.
모순 해결 (Contradiction Handling): 어떤 단위가 '적어도 3 등급'과 '적어도 2 등급 이하'라는 모순된 규칙에 동시에 만족할 수 있는 경우를 방지하기 위해, **최대 규칙 집합 (Maximal Rules)**을 선별하고 **혼합 정수 계획법 (MILP)**을 사용하여 모순이 없는 최소 규칙 집합을 추출합니다.
결측치 처리 (Missing Values): 데이터에 결측치가 있을 경우, 결측치를 대체하지 않고도 규칙 유도 알고리즘 (Algorithm 4) 을 수정하여 적용 가능합니다. 규칙의 조건부는 결측이 아닌 값들만 기반으로 하며, 결측치는 임의의 값으로 대체될 수 있다고 가정하여 규칙의 유효성을 유지합니다.

3. 주요 기여 (Key Contributions)

규칙 기반 복합 지표 프레임워크: 가중치나 복잡한 집계 함수 없이, 자연어 기반의 결정 규칙만으로 복합 지표를 구성하거나 설명하는 최초의 방법론적 제안입니다.
투명성과 공정성 확보: "왜 이 등급이 부여되었는지"에 대한 명확한 논리 (예: "학교 교육 연수가 11 년 이상이고 1 인당 GNI 가 3200 달러 이상이면 인간개발지수가 높음") 를 제공하여 이해관계자의 신뢰를 높입니다.
연속형 지표 및 결측치 대응:
- 연속적인 점수를 별도의 클래스로 간주하여 규칙을 유도할 수 있어, 이산적 분류뿐만 아니라 연속 점수에도 적용 가능합니다.
- 결측치가 있는 데이터셋에서도 imputation 없이 직접 분석이 가능하여 실용성을 높였습니다.
효율적인 알고리즘: 모든 가능한 규칙을 한 번에 생성하고, MILP 를 통해 모순을 제거하며 최소한의 규칙 집합을 찾는 체계적인 절차를 제시했습니다.

4. 결과 및 사례 연구 (Results & Case Studies)

논문은 네 가지 시나리오에 대한 구체적인 사례 연구를 통해 방법론의 유효성을 입증했습니다.

사례 1 (의료): 글래스고 혼수 척도 (GCS) 데이터를 사용하여 환자 등급을 결정 규칙으로 설명하고, 새로운 환자에 대한 등급을 예측했습니다.
사례 2 (국가 개발): 인간개발지수 (HDI) 데이터를 사용하여 193 개국의 등급을 설명하는 17 개의 'at-least' 규칙과 14 개의 'at-most' 규칙을 도출했습니다. (예: 세네갈이 저개발국으로 분류된 이유를 '예상 학교 교육 연수'와 '평균 학교 교육 연수'가 낮기 때문으로 설명).
사례 3 (포트폴리오 선정): 주식 포트폴리오 선정 문제에서 DM 의 선호를 기반으로 규칙을 생성하고, 새로운 주식에 대한 등급을 부여했습니다. 모순이 발생하는 경우 MILP 를 통해 해결했습니다.
사례 4 (호텔 입지 선정): ELECTRE-Score 방법으로 점수를 매긴 데이터를 DRSA 규칙으로 변환하여 설명력을 높였습니다.
결측치 처리 (PISA 데이터): PISA 학생 데이터를 사용하여 결측치가 있는 상황에서도 규칙을 유도하고 새로운 학생을 정확하게 분류하는 것을 시연했습니다.

5. 의의 및 결론 (Significance & Conclusion)

이론적 의의: AI 의 설명 가능성 (XAI) 개념을 MCDA 및 복합 지표 분야에 성공적으로 접목시켰습니다. '블랙박스' 평가에서 '유리상자 (Glass Box)' 평가로의 전환을 주도합니다.
실무적 의의: 정책 입안자, 연구자, 일반 대중이 복합 지표의 산출 논리를 쉽게 이해하고 검증할 수 있게 하여, 지표의 신뢰성과 수용성을 높입니다.
한계 및 향후 과제: 고차원 데이터 (기준이 매우 많은 경우) 에서 규칙의 수가 기하급수적으로 증가할 수 있으나, 관심 있는 단위에만 해당 규칙을 보여줌으로써 이를 완화할 수 있습니다. 또한, 입력 데이터의 품질과 대표성이 규칙의 유효성에 직접적인 영향을 미친다는 점을 지적했습니다.

요약하자면, 이 논문은 복합 지표의 구성과 해석을 위해 DRSA 기반의 결정 규칙을 도입함으로써, 가중치와 집계 방식의 불투명성을 제거하고, 결측치 처리와 모순 해결을 포함한 강력한 방법론적 프레임워크를 제시했습니다. 이는 데이터 기반 의사결정의 투명성과 공정성을 확보하는 데 중요한 기여를 합니다.