BD-Merging: Bias-Aware Dynamic Model Merging with Evidence-Guided Contrastive Learning

Each language version is independently generated for its own context, not a direct translation.

🍳 문제: "요리사들을 한 명으로 합치려니 생기는 혼란"

상상해 보세요.

A 요리사는 스테이크를 아주 잘 굽습니다.
B 요리사는 초밥을 아주 잘 만듭니다.
C 요리사는 파스타를 아주 잘 만듭니다.

이 세 명의 요리사 (각각 훈련된 AI 모델) 를 하나로 합쳐서 **한 명의 '만능 요리사'**를 만들고 싶다고 칩시다. 보통은 세 사람의 기술을 단순히 섞으면 됩니다.

하지만 문제는 여기서 발생합니다.
실제 식당 (실제 세상) 에 손님이 오면, 날씨가 갑자기 흐려지거나 (데이터 왜곡), 전혀 새로운 메뉴를 주문하거나 (보지 못한 작업) 합니다.
기존 방식은 "우리가 훈련할 때 봤던 깨끗한 재료만 가정하고" 요리사들을 합쳤기 때문에, 날씨가 흐려지거나 낯선 손님이 오면 요리사들이 당황해서 엉뚱한 요리를 내놓거나, 맛을 망칩니다.

이게 바로 이 논문이 해결하려는 **'테스트 시간의 편향 (Test-time Bias)'**과 '분포 변화 (Distribution Shift)' 문제입니다.

💡 해결책: BD-Merging (편향을 아는 똑똑한 합성)

저자들은 이 문제를 해결하기 위해 BD-Merging이라는 새로운 방법을 제안했습니다. 이 방법은 세 가지 핵심 아이디어로 이루어져 있습니다.

1. "내가 얼마나 확신하는지"를 묻는 '의심스러운 머릿속' (Evidence-Guided Learning)

기존 방식은 요리사가 "이건 스테이크야!"라고 100% 확신하며 말하면 그걸 믿었습니다. 하지만 BD-Merging 은 요리사에게 **"이게 스테이크라고 얼마나 확신해? 아니면 흐린 날씨 때문에 고기인지 생선인지 헷갈리는 거 아니야?"**라고 물어봅니다.

비유: AI 는 자신의 답변에 대한 '증거 (Evidence)'를 모아서, "나는 90% 확신해"라고 말하거나, "날씨가 너무 흐려서 50% 만 확신해"라고 솔직하게 말합니다. 이렇게 자신의 불확실성을 인정하는 능력을 먼저 가르칩니다.

2. "이웃과 비교해 봐" (인접성 불일치 점수 - ADS)

요리사가 혼자서 판단하는 게 아니라, 주변에 있는 다른 요리사들 (이웃 데이터) 과 비교해 봅니다.

"너는 스테이크라고 확신하는데, 옆에 있는 요리사는 생선이라고 확신하고 있어? 뭔가 이상한 일이 일어나고 있구나!"
이 **'이웃과의 차이 (Discrepancy)'**를 점수로 매깁니다. 만약 주변과 너무 다르면, 그 데이터는 '깨끗한 데이터'가 아니라 '문제 있는 데이터 (오염된 데이터)'일 가능성이 높다고 판단합니다.

3. "상황에 따라 요리사들을 바꿔 쓰는 '스마트 매니저'" (Debiased Router)

가장 중요한 부분입니다. BD-Merging 은 모든 데이터를 똑같이 처리하지 않습니다.

깨끗한 데이터가 들어오면? → 스테이크 요리사 (A) 의 기술을 더 많이 참고합니다.
흐린 날씨나 낯선 데이터가 들어오면? → "아, 이건 A 요리사가 헷갈려 하는구나. B 요리사나 C 요리사의 지식을 더 섞어서 보자"라고 실시간으로 조합 비율을 바꿉니다.

이 '스마트 매니저 (라우터)'는 AI 가 어떤 상황에 처해 있는지 감지하고, 가장 적합한 전문가들의 지식을 그 순간에 맞춰 섞어줍니다.

🚀 왜 이것이 중요한가요? (결과)

이 방법을 사용하면 다음과 같은 이점이 있습니다.

튼튼함 (Robustness): 날씨가 나빠지거나 (노이즈), 데이터가 망가져도 AI 가 당황하지 않고 제 역할을 합니다. 마치 비가 와도 스테이크를 잘 굽는 요리사처럼요.
적응력 (Generalization): 아예 처음 보는 메뉴 (새로운 작업) 가 들어와도, 기존에 배운 지식들을 잘 조합해서 새로운 요리를 만들어냅니다.
효율성: 처음부터 모든 데이터를 다시 가르칠 필요 없이, 이미 훈련된 모델들을 합쳐서 바로 쓸 수 있습니다.

📝 한 줄 요약

"BD-Merging 은 AI 가 '내가 헷갈리는 상황'을 스스로 알아차리고, 상황에 맞춰 여러 전문가의 지식을 똑똑하게 섞어주는 '스마트 매니저'를 도입하여, 예측 불가능한 현실 세상에서도 AI 가 실수 없이 잘 작동하게 만드는 기술입니다."

이 기술은 AI 가 실제 세상 (실제 식당) 에서 더 안전하고 신뢰할 수 있게 쓰이도록 도와줍니다.

Each language version is independently generated for its own context, not a direct translation.

1. 문제 정의 (Problem Statement)

**모델 병합 (Model Merging, MM)**은 별도의 재학습 없이 여러 태스크별 모델을 통합하여 다중 태스크 학습 (MTL) 을 가능하게 하는 확장 가능한 패러다임입니다. 그러나 기존 MM 방법론들은 테스트 시 분포 변화 (Test-time Distribution Shift) 하에서의 신뢰성에 큰 한계가 있습니다.

주요 가정의 한계: 기존 방법들은 테스트 데이터가 학습 데이터 및 보조 소스와 분포적으로 정렬되어 있다고 가정하지만, 실제 세계에서는 이 가정이 거의 성립하지 않습니다.
분포 변화의 두 가지 형태:
1. 테스트 시 편향 (Test-time Bias): 센서 노이즈, 전송 왜곡, 환경적 변화 등으로 인한 데이터 손상 (Intra-task corruption).
2. 보이지 않는 태스크에 대한 일반화 (Generalization to Unseen Tasks): 병합 과정에서 학습되지 않은 태스크나 도메인에 대한 적응 실패 (Inter-task discrepancy).
현재의 문제점: 분포 변화가 발생하면 병합된 모델 간의 표현 정렬이 깨져 예측 편향이 발생하고, 성능이 급격히 저하됩니다. 기존 방법들은 이러한 샘플 수준의 미세한 불일치를 포착하지 못해 견고성 (Robustness) 과 일반화 능력이 부족합니다.

2. 제안 방법론: BD-Merging

저자들은 BD-Merging을 제안했습니다. 이는 편향을 인식하고 (Bias-Aware), 불확실성을 명시적으로 모델링하여 분포 변화 하에서 적응적인 신뢰성을 확보하는 비지도 모델 병합 프레임워크입니다.

핵심 구성 요소

공동 증거 헤드 (Joint Evidential Head):
- 사전 학습된 백본에 통합되어 **증거 기반 딥러닝 (Evidential Deep Learning, EDL)**을 수행합니다.
- 디리클레 (Dirichlet) 분포를 기반으로 각 예측에 대한 클래스별 증거 (Evidence) 를 생성합니다.
- **상호 클래스 증거 대비 (Inter-class Evidential Contrast, IEC)**를 도입하여 클래스 간 의존성과 경쟁 관계를 고려한 불확실성 추정을 강화합니다.
- 예측 정확도와 인식적 불확실성 (Epistemic Uncertainty) 보정을 위해 엔트로피 기반 손실과 역상관 손실 (Inverse Correlation Loss) 을 결합하여 학습합니다.
인접 불일치 점수 (Adjacency Discrepancy Score, ADS):
- 특징 공간에서 샘플의 인접 집합 (Adjacency Set) 내에서 증거 정렬 정도를 정량화합니다.
- 세 가지 요소를 결합하여 계산합니다:
  - 예측 날카로움 (Prediction Sharpness): 이웃 샘플의 증거 집중도 (인지적 불확실성).
  - 의미적 발산 (Semantic Divergence): 대상 샘플과 이웃 간의 클래스 수준 분포 차이.
  - 의견 충돌 (Opinion Conflicts): 특정 이웃 간의 믿음 (Belief) 불일치 정도.
- 이 점수 ( $d_{ik}$ ) 는 샘플이 분포 변화 (오염 또는 OOD) 에 노출되었는지를 판단하는 지표로 작용합니다.
불일치 인식 대비 학습 (Discrepancy-Aware Contrastive Learning):
- ADS 를 기반으로 인접 집합을 양성 (일致하는) 샘플과 음성 (충돌하는) 샘플로 동적으로 분할합니다.
- 일관된 샘플은 끌어당기고 (Pull), 충돌하는 샘플은 밀어내는 (Push) 대비 학습 전략을 적용하여 병합된 표현을 정제합니다.
편향 제거 라우터 (Debiased Router):
- 학습된 증거와 대비 학습을 통해 훈련된 라우터 네트워크입니다.
- 테스트 시 입력 샘플마다 태스크별 또는 레이어별 가중치를 동적으로 할당합니다.
- 이를 통해 분포 변화가 있는 샘플에 대해 태스크 간 간섭을 줄이고, 적응적인 지식 공유를 가능하게 합니다.

3. 주요 기여 (Key Contributions)

문제 재정의: 테스트 시 분포 변화 하에서 모델 병합의 신뢰성 문제를 재조명하고, '상충되는 지식/편향된 통합'과 '제한된 태스크 간 일반화'라는 두 가지 핵심 과제를 식별했습니다.
BD-Merging 프레임워크 제안:
- 증거 기반 불확실성 모델링을 통해 샘플 수준의 편향을 명시적으로 모델링합니다.
- 공동 증거 헤드, ADS, 불일치 인식 대비 학습을 결합하여 편향 제거 라우터를 학습시킵니다.
성능 입증: 다양한 태스크와 분포 변화 시나리오에서 기존 최첨단 (SOTA) 모델 병합 방법들보다 우수한 견고성과 일반화 성능을 달성함을 실험을 통해 입증했습니다.

4. 실험 결과 (Results)

테스트 시 편향 (Test-time Bias):
- 다양한 이미지 분류 태스크 (SUN397, Cars, MNIST 등 8 개) 에서 노이즈, 흐림, 색상 변화 등 3 단계의 손상 (L1~L3) 을 가한 실험에서 BD-Merging 이 가장 우수한 성능을 보였습니다.
- 기존 방법들 (Task Arithmetic, Ties-Merging, AdaMerging 등) 은 손상 강도가 증가함에 따라 성능이 급격히 하락한 반면, BD-Merging 은 성능 저하폭을 최소화했습니다 (예: L3 손상 시 평균 정확도 하락폭이 기존 방법 대비 1.8~2.6% 적음).
보이지 않는 태스크 일반화 (Unseen Generalization):
- 학습된 태스크와 학습되지 않은 태스크가 혼합된 환경에서 BD-Merging 은 학습된 태스크에서 높은 정확도 (94.53%) 를 유지하면서, 보이지 않는 태스크에서도 55.01% 의 높은 정확도를 기록했습니다.
- 기존 방법들은 보이지 않는 태스크에서 성능이 50% 미만으로 급락하는 과적합 (Overfitting) 경향을 보였습니다.
효율성:
- 개별 모델 (Individual Fine-tuning) 에 근접한 성능을 내면서도, AdaMerging w/Surgery 와 같은 고비용 방법보다 계산 비용 (시간) 이 훨씬 낮아 실용성이 뛰어납니다.

5. 의의 및 결론 (Significance)

실용적 적용 가능성: BD-Merging 은 재학습 없이도 분포 변화가 심한 실제 환경 (Real-world Deployment) 에서 모델 병합의 신뢰성을 크게 향상시킵니다.
동적 적응성: 고정된 병합 가중치를 사용하는 기존 방식과 달리, 테스트 시 입력 데이터의 특성에 따라 동적으로 가중치를 조절하는 '편향 제거 라우터'를 통해 태스크 간 간섭을 효과적으로 해결합니다.
불확실성 활용의 확장: 딥러닝의 불확실성 추정 (EDL) 을 모델 병합 과정에 성공적으로 접목하여, 데이터의 품질과 분포 적합성을 실시간으로 판단하고 이를 병합 전략에 반영하는 새로운 패러다임을 제시했습니다.

이 논문은 모델 병합 기술이 단순한 파라미터 평균화를 넘어, 분포 변화에 강건한 지능형 통합 시스템으로 발전할 수 있음을 보여주는 중요한 연구입니다.