원저자: Ao Sun, Xiaoyu Wang, Zhe Tan, Yu Li, Jiachen Zhu, Shu Su, Yuheng Jia

게시일 2026-06-12

📖 4 분 읽기☕ 가벼운 읽기

원저자: Ao Sun, Xiaoyu Wang, Zhe Tan, Yu Li, Jiachen Zhu, Shu Su, Yuheng Jia

원본 논문은 CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/) 라이선스로 제공됩니다. ✨ 이것은 아래 논문에 대한 AI 생성 설명입니다. 저자가 작성하거나 승인한 것이 아닙니다. 기술적 정확성을 위해서는 원본 논문을 참조하세요. 전체 면책 조항 읽기

핵심 문제: "희석된 중간 지점 (The Diluted Middle)"

당신이 두 그룹의 서로 다른 입맛을 모두 만족시키기 위해 하나의 솥에 수프를 끓이려는 요리사라고 상상해 보세요.

그룹 A는 맵고 강렬한 맛을 좋아합니다.
그룹 B는 순하고 담백하며 편안한 맛을 선호합니다.

만약 당신이 모든 재료를 평균적으로 섞어서 모두에게 "완벽한" 수프 한 솥을 만들려고 한다면, 결국 약간 매콤하면서도 약간 담백한, 특징 없는 미지근한 수프가 되어버릴 것입니다. 안전하긴 하겠지만, 아무런 맛도 나지 않는 상태가 됩니다. 결과적으로 그 누구도 진정으로 만족하지 못하게 됩니다.

AI의 세계에서는 이를 **평균 붕괴(Mean Collapse)**라고 부릅니다.

AI (요리사): 대규모 언어 모델(LLM)은 전 세계의 데이터를 학습합니다.
갈등: 문화마다 가치관이 다릅니다. 어떤 나라에서 "예의 바른" 것이 다른 나라에서는 "무례한" 것일 수 있습니다.
실수: 현재의 AI 모델들은 모두를 위한 '하나의 규칙'을 배우려고 합니다. 모델이 상충하는 문화적 가치에 직면했을 때, AI는 혼란을 겪습니다. 그룹 A를 위해 매콤하게 만들거나 그룹 B를 위해 담백하게 만드는 대신, 그저 누구에게도 완벽히 맞지 않는 일반적이고 "평균적인" 답변에 안주하게 됩니다. 이것이 바로 "희석된 중간 지점"입니다.

원인: "문화적 희소성 (Cultural Sparsity)"

이 논문은 인간의 가치관이 매끄럽고 연속적인 선(예: 밝기 조절 다이얼)이 아니라, **희소(sparse)**하고 군집화되어 있다고 주장합니다.

비유: 문화적 가치를 바다 위에 떠 있는 뚜렷한 섬들이라고 생각해보세요. "개인주의 섬"과 "집단주의 섬"이 있습니다. 이들은 서로 멀리 떨어져 있습니다.
문제: 표준적인 AI 모델은 이 섬들을 연결하려고 하는 하나의 단단한 다리와 같습니다. 하지만 다리는 반드시 중간을 지나야 하기 때문에, 결국 두 섬 사이의 텅 빈 바다 위에 떠 있게 됩니다. 실제 육지 근처에는 도달하지 못하는 것이죠. 다리는 동시에 두 섬 위에 있을 수 없습니다.

해결책: CUMA (스마트한 웨이터)

저자들은 CUMA(Cultural Mixture of Adapters)라는 새로운 프레임워크를 제안합니다. 하나의 뇌가 모든 것을 처리하도록 강요하는 대신, CUMA는 방대한 메뉴를 가진 레스토랑의 스마트한 웨이터처럼 행동합니다.

작동 방식은 다음과 같습니다:

인구통계학적 인식 (당신이 누구인지 아는 것):
당신이 레스토랑에 들어오면, 웨이터는 단순히 "무엇을 드시겠습니까?"라고 묻는 데 그치지 않습니다. 그들은 당신의 배경(문화, 지역 등)을 살핍니다.
- 논문 내용: AI는 "데모그래픽 인코더(Demographic Encoder)"를 사용하여 사용자의 배경(예: "태국 출신의 55세 불교 신자")을 이해합니다.
라우터 (스마트한 웨이터):
웨이터는 각 테이블마다 필요한 요리사가 다르다는 것을 알고 있습니다.
- 만약 전통적인 고객이 "인생의 결정을 어떻게 내려야 하나요?"라고 묻는다면, 웨이터는 주문을 셰프 A(가족 가치와 장기적 안정을 전문으로 하는 셰프)에게 보냅니다.
- 만약 세속적인 고객이 같은 질문을 한다면, 웨이터는 주문을 셰프 B(개인의 열정과 자유를 전문으로 하는 셰프)에게 보냅니다.
특화된 셰프들 (어댑터):
레스토랑에는 기본 요리를 할 줄 아는 메인 주방(동결된 베이스 모델)이 있습니다. 하지만 특정 문화적 요구를 충족하기 위해, 이 주방에는 특화된 미니 주방들(어댑터라고 불림)이 붙어 있습니다.
- 이 미니 주방들은 작고 효율적입니다. 이들은 레스토랑 전체를 다시 쓰는 것이 아니라, 요리에 특유의 "풍미"를 더할 뿐입니다.
- 결정적으로, 셰프 A와 셰프 B는 서로 대화하지 않습니다. 이는 그들이 레시피를 섞어서 다시 "희석된 중간"의 수프를 만들어내는 것을 방지합니다.

왜 더 나은가?

논문은 이 아이디어를 세 가지 벤치마크(WorldValuesBench, Community Alignment, PRISM)로 테스트했습니다. 결과는 다음과 같습니다:

더 이상 일반적인 답변을 내놓지 않음: CUMA 모델은 단순히 안전하고 지루한 답변을 주는 것에 그치지 않았습니다. 질문하는 사람에게 딱 맞는 구체적인 답변을 제공했습니다.
다양성 보존: 다른 모델들이 모든 것을 평균화하려고 노력할 때, CUMA는 "매콤한" 맛과 "담백한" 맛을 뚜렷하게 유지했습니다. 이는 하나의 AI 시스템이 여러 문화가 서로 섞여 뭉개지지 않으면서도 많은 다양한 문화를 존중할 수 있음을 증명했습니다.
지도의 학습: "웨이터"(라우터)는 실제로 세상의 숨겨진 지도를 학습했습니다. 설령 특정 국가를 본 적이 없더라도, 그 나라의 이웃 국가들을 바탕으로 어떤 "셰프"에게 주문을 보낼지 추측할 수 있었습니다. 모델은 명시적으로 지시받지 않고도 세상을 문화적 클러스터(예: "유교권" 또는 "아프리카-이슬람 블록")로 조직화했습니다.

결론

이 논문은 AI가 전 세계적인 관객에게 진정으로 도움이 되기 위해서는, 단순히 "하나의 진리"를 가르치는 것만으로는 부족하다고 주장합니다. 우리는 AI에게 누가 묻고 있는지를 인식하고, 그 사람에게 맞는 **"문화적 사고방식"**으로 전환하는 법을 가르쳐야 합니다.

CUMA는 AI의 뇌를 전문화된 전문가들로 나누고, 사용자의 배경에 따라 질문을 적절한 전문가에게 전달하는 스마트한 시스템을 사용하여 이 일을 수행합니다. 이를 통해 AI가 지루하고 평균적인 답변에 머무는 것을 방지하고, 현실 세계의 풍요롭고 다양하며 때로는 상충하는 가치들을 존중할 수 있게 합니다.

기술 요약: CUMA – 인구 통계학적 인식을 통한 희소한 문화적 가치와 LLM의 정렬 (Demographic-Aware Mixture of Adapters)

1. 문제 정의: 문화적 희소성과 평균 붕괴 (Mean Collapse)

본 논문은 글로벌하고 다원적인 청중에게 적용될 때 발생하는 현재의 대규모 언어 모델(LLM) 정렬 패러다임의 근본적인 한계를 지적한다. 안전성이나 수학과 같은 합의 기반 과업에는 RLHF와 같은 표준 정렬 기술이 효과적이지만, 최적의 응답이 사용자 인구 통계에 따라 달라지고 본질적으로 상충할 수 있는 문화적 정렬(Cultural Alignment) 문제에서는 어려움을 겪는다.

저자들은 기존 방식이 상충하는 문화적 가치 분포에 대해 **밀집된 파라미터 집합(dense set of parameters)**을 최적화한다고 주장한다. 이는 **평균 붕괴(Mean Collapse)**라고 명명된 현상을 초래한다.

문화적 희소성 (Cultural Sparsity): 인간의 가치는 연속적인 스펙트럼이 아니라 잠재 표현 공간 내에서 구별되고 희소한 클러스터(모드, modes)를 형성한다 (예: 전통적/집단주의적 vs 세속적/개인주의적).
그래디언트 간섭 (Gradient Interference): 단일 밀집 모델이 이러한 불연속적인 모드들을 동시에 적합시키려 할 때, 상충하는 그룹들로부터 오는 그래디언트가 서로 간섭한다.
결과: 전역 오차를 최소화하기 위해 모델은 통계적 평균인 "희석된 중간 지점(diluted middle)"으로 수렴한다. 이는 독특한 문화적 정체성을 표현하지 못하고 지배적인 (WEIRD - 서구적, 교육받고, 산업화되고, 부유하고, 민주적인) 규범을 기본값으로 설정하는, 일반적이고 공명력이 낮은 응답을 생성하게 한다. 즉, 모델은 개별적인 문화적 정체성을 억제하고 단일한 합의를 따르는 "모드 덮기(mode-covering)" 동작을 보인다.

2. 방법론: CUMA (Cultural Mixture of Adapters)

평균 붕괴를 해결하기 위해 저자들은 CUMA를 제안하며, 이를 문화적 정렬을 **조건부 용량 분리 문제(conditional capacity separation problem)**로 재정의한다. 단일 파라미터 세트가 모든 문화를 대표하도록 강요하는 대신, CUMA는 상충하는 그래디언트를 특화된 전문가 서브스페이스(specialized expert subspaces)로 분리한다.

핵심 아키텍처

CUMA는 Mixture-of-Experts (MoE) 구조를 기반으로 구축되었으나, 새로운 인구 통계 인식 라우팅(Demographic-Aware Routing) 메커니즘을 도입했다.

인구 통계 인코더 (Demographic Encoder):
- 구조화된 인구 통계 프로필(예: 국가, 종교, 연령)을 자연어 설명으로 선형화한다.
- 이러한 설명은 사전 학습된 문장 임베딩 모델을 사용하여 밀집 벡터 임베딩( $e_d$ )으로 매핑된다. 이는 사전 학습 과정에서 문화적으로 유사한 그룹들이 자연스럽게 클러스터링되는 기하학적 사전 지식(geometric priors)을 활용한다.
토폴로지 학습기 (Router):
- 단순히 의미론적 은닉 상태( $h$ )에 기반하여 토큰을 배정하는 표준 MoE 라우터와 달리, CUMA 라우터는 의미론적 컨텍스트와 인구 통계 프로필의 결합 표현( $[h \oplus e_d]$ )을 조건으로 의사결정을 내린다.
- 이를 통해 라우터는 무엇이 질문되고 있는지와 누가 질문하고 있는지를 구분하는 **잠재적 문화 토폴로지(Latent Cultural Topology)**를 학습할 수 있다.
- 라우터는 상충하는 그래디언트의 구조적 격리를 보장하기 위해 $k$ 개의 전문가를 희소하게 활성화한다 (Top- $k$ gating).
문화적 어댑터 혼합 (Mixture of Cultural Adapters):
- 백본 LLM 가중치( $W_0$ )는 동결된다.
- 전문가 풀은 LoRA (Low-Rank Adaptation) 모듈로 구성된다. 각 전문가는 특정 문화적 모드에 특화된 저차원 업데이트( $\Delta W = BA$ )를 학습한다.
- 최종 출력은 동결된 백본과 선택된 LoRA 전문가들의 가중합으로 계산되어, 상충하는 문화적 가치가 별도의 파라미터 조합에 의해 처리되도록 보장한다.

최적화

프레임워크는 유연한 학습 전략을 사용한다:

조건부 지도 미세 조정 (Conditional SFT): 기초적인 정렬을 확립한다.
조건부 선호도 최 оптимиization (DPO/GRPO): 선호도 데이터가 가용할 때 정렬을 정교화한다.
손실 함수: 활성 태스크 손실과 함께, 전문가 붕괴를 방지하고 문화적 토폴로지의 효과적인 활용을 보장하기 위한 보조 로드 밸런싱 정규화( $L_{lb}$ )를 결론한다.

3. 주요 기여

평균 붕패의 이론적 규명: 저자들은 문화적 희소성을 다원적 환경에서 정렬 실패의 기하학적 근원으로 공식 정의했다. 그들은 밀집된 파라미터화가 필연적으로 개별 문화 모드를 포착하지 못하는 전역 혼합 평균으로 수렴한다는 것을 증명했다 (정리 2.1).
CUMA 프레임워크: 조건부 용량 분리를 구현하는 새로운 아키텍처를 제안했다. 인구 통계 프로필을 조건으로 라우팅함으로써, CUMA는 그래디언트 간섭을 격리하고 잠재적 문화 토폴로지를 학습하여 그래디언트를 명시적으로 분리한다.
실증적 검증: 광범한 평가를 통해 CUMA가 밀집 베이스라인 및 의미론적 전용 MoE 방식보다 성능이 우수함을 입증했다.

4. 실험 결과

저자들은 Llama-3.1-8B 및 Qwen3-8B 백본을 사용하여 WorldValuesBench (WVB), Community Alignment (CA), PRISM의 세 가지 벤치마크에서 CUMA를 평가했다.

밀집 베이스라인 대비 성능: CUMA는 밀집 미세 조정 방식(Full Fine-Tuning, LoRA, Doora) 및 추론 시점 베이스라인을 일관되게 능가했다.
- WorldValuesBench에서 CUMA는 Llama-3.1 기준 50.46%, Qwen3 기준 **50.64%**의 정확도를 달이트했으며, 이는 Full Fine-Tuning(각각 45.25%, 45.54%)을 크게 상회하는 수치다.
- 결정적으로, CUMA는 훨씬 낮은 Wasserstein-1 거리 (EMD) (FFT의 0.2205 대비 0.1870)를 기록했는데, 이는 CUMA가 단순히 최빈값을 예측하는 것을 넘어 인간 가치의 구조적 분포를 더 잘 포착함을 나타낸다.
평균 붕괴 완화:
- 엔트로피 분석: 밀집 모델은 결정적이지 않고 "희석된" 출력을 나타내는 높은 예측 엔트로피( $H \approx 1.38$ )를 보였다. 반면 CUMA는 이를 $H \approx 1.17$ 로 낮추어, 특정 인구 통계에 대해 더 날카롭고 결정적인 정렬을 보여주었다.
- 생성 다양성: 개방형 생성 작업에서 CUMA는 가장 높은 Distinct-2 점수(0.5232)를 기록하여, 반복적인 일반 템플릿을 피하고 특화된 문화적 어휘를 활용함을 확인했다.
일반화 (Zero-Shot): CUMA는 학습되지 않은 인구 통계 그룹에 대해서도 강력한 일반화 능력을 보였다. 홀드아웃 프로필 테스트 시 정확도 하락이 미미했던 반면(-2.12%), 밀집 베이스라인은 훨씬 큰 하락을 겪었다 (예: LoRA -7.66%).
잠재 토폴로지 시각화: 전문가 활성화 패턴의 t-SNE 투영 결과, 라우터는 명시적인 그룹화 감독 없이도 65개 국가를 사회학적 프레임워크(예: 아프리카-이슬람, 유교, 개신교 유럽)와 일치하는 일관된 클러스터로 자발적으로 조직했다.

5. 의의 및 주장

본 논문은 문화적 가치의 희소성을 존중하는 것이 진정으로 다원적인 LLM을 구축하는 핵심이라고 주장한다.

패러다임 전환: 이 연구는 정렬이 보편적 합의를 강요하는 것에서 문화적 다원성을 존중하는 것으로 전환되어야 한다고 주장한다. 현재 모델의 실패는 데이터나 파라미터의 부족이 아니라, 밀집된 아키텍처가 상충하는 가치 모드를 처리할 수 없는 구조적 능력의 문제라고 본다.
인구 통계 조건화: 저자들은 의미론적 내용에만 기반한 라우팅은 문화적 정렬에 불충분하다는 것을 입증했다. 그래디언트를 분리하는 데 필요한 잠재적 문화 토폴로지를 학습하기 위해서는 인구 통계 프로필에 대한 명시적 조건화가 필수적이다.
효율성: CUMA는 더 큰 밀집 모델이나 의미론적 전용 MoE 베이스라인보다 더 적은 학습 가능 파라미터(예: $r=8$ 일 때 1.53%)를 사용하면서도 우수한 결과를 얻었으며, 이는 문화적 정렬을 위해 파라미터 규모보다 라우팅의 정밀도가 더 중요하다는 것을 증명한다.

저자들은 CUMA가 평균 붕합을 효과적으로 완화하여 문화적 다양성을 보존하고, 다양한 사용자에게 구별되고 문화적으로 공명하는 결과를 생성할 수 있게 한다고 결론짓는다.

CuMA: Aligning LLMs with Sparse Cultural Values via Demographic-Aware Mixture of Adapters