Rethinking Personalization in Large Language Models at the Token Level

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"대형 언어 모델 (LLM) 이 개인에게 더 잘 맞춰진 답변을 하도록 하는 새로운 방법"**을 제안합니다.

기존의 AI 는 모든 사용자에게 똑같은 방식으로 답변을 학습했지만, 이 논문은 **"답변의 한 글자 (토큰) 마다 개인화 정도가 다르다"**는 사실을 발견하고, 이를 해결하는 **'PerCE'**라는 기술을 개발했습니다.

이 복잡한 내용을 일상적인 비유로 쉽게 설명해 드릴게요.

1. 문제: "모든 단어에 똑같은 점수를 매기면 안 돼요!"

비유: 요리사와 손님
기존의 AI 학습 방식은 마치 모든 재료를 똑같은 중요도로 취급하는 요리사와 같습니다.

상황: 손님이 "저는 매운 걸 좋아해요"라고 했을 때, AI 는 "매운"이라는 단어와 "맛있는"이라는 단어를 똑같은 비중으로 학습합니다.
문제: 하지만 실제로는 "매운"이라는 단어가 손님의 취향을 반영하는 핵심 열쇠인 반면, "맛있는"은 누구나 쓰는 일반적인 단어일 뿐입니다.
결과: AI 는 중요한 단어 ("매운") 에 집중하지 못하고, 모든 단어를 평평하게 학습하다 보니 사용자의 개성을 제대로 담아내지 못합니다.

2. 해결책 1 단계: "PerContrast" (개인화 감지기)

이 논문은 먼저 **"이 단어가 정말로 그 사용자의 취향을 반영하고 있을까?"**를 측정하는 도구를 만들었습니다. 이를 PerContrast라고 부릅니다.

비유: "만약에..." 게임

방법: AI 가 답변을 할 때, 사용자의 정보 (예: "매운 걸 좋아함") 를 빼고 다시 한번 상상해 봅니다.
- A 경우: "나는 매운 걸 좋아해. 그래서 이 요리는 매운맛이야." (사용자 정보 포함)
- B 경우: "나는 매운 걸 좋아해. 그래서 이 요리는 맛있는맛이야." (사용자 정보 제거)
판단: 만약 사용자 정보를 빼자마자 "매운"이라는 단어가 사라지거나 확률이 급격히 변했다면? → 이 단어는 사용자의 취향을 반영한 '핵심 단어'입니다!
역할: 이 도구는 답변의 각 단어마다 "개인화 점수"를 매겨줍니다.

3. 해결책 2 단계: "PerCE" (핵심 단어 집중 훈련)

이제 AI 를 훈련시킬 때, 이 점수를 활용합니다. 기존 방식은 모든 단어에 똑같은 점수를 주었지만, 이 새로운 방식인 PerCE는 점수가 높은 단어 (핵심 단어) 에 더 많은 점수를 줍니다.

비유: "스타 플레이어에게 더 많은 공을 주는 축구 코치"

기존 방식 (Cross-Entropy): 축구 코치가 모든 선수에게 똑같은 횟수로 공을 넘겨주며 훈련시킵니다. (핵심 공격수나 수비수나 똑같음)
새로운 방식 (PerCE): 코치는 경기 중 "저 선수 (핵심 단어) 가 상대를 뚫는 데 가장 중요해!"라고 판단합니다. 그래서 훈련 시간의 80% 를 그 핵심 선수에게 집중시킵니다.
효과: AI 는 사용자의 취향을 결정짓는 '핵심 단어'를 훨씬 더 잘 기억하고, 자연스럽게 그 스타일로 답변을 생성하게 됩니다.

4. 왜 이것이 중요한가요? (결과)

이 방법을 적용한 실험 결과는 놀라웠습니다.

성능 향상: 기존 방식보다 개인화 성능이 평균 10% 이상, 최대 68% 까지 향상되었습니다.
비용 효율: "핵심 단어"를 찾는 과정이 매우 가볍습니다. 마치 요리할 때 재료 하나를 덜 넣는 것만큼의 추가 비용만 들면 됩니다.
범용성: 대화, 글쓰기, 요약 등 다양한 상황에서, 그리고 서로 다른 AI 모델에서도 잘 작동했습니다.

5. 한 줄 요약

이 논문은 **"AI 가 사용자의 개성을 배울 때, 모든 단어를 똑같이 대우하지 말고, 사용자의 취향을 가장 잘 드러내는 '핵심 단어'에 집중해서 가르쳐야 한다"**는 사실을 발견하고, 이를 실현하는 효율적이고 강력한 훈련 방법을 제시했습니다.

결론: 이제 AI 는 사용자의 "취향"을 더 잘 이해하고, 마치 그 사람처럼 말하고 글을 쓸 수 있게 되었습니다.

Each language version is independently generated for its own context, not a direct translation.

1. 문제 제기 (Problem)

대형 언어 모델 (LLM) 이 다양한 작업에서 뛰어난 성능을 보이며 보편화됨에 따라, 사용자의 프로필, 선호도, 상호작용 이력에 맞춰 출력을 개인화 (Personalization) 하려는 요구가 급증하고 있습니다. 그러나 기존 개인화 연구는 다음과 같은 근본적인 한계를 가지고 있습니다.

토큰 수준의 차별화 부재: 개인화 작업은 기본 NLP 작업 위에 추가된 레이어로 간주되지만, 기존 훈련 방식은 응답 내의 모든 토큰을 균일하게 취급합니다 (일반적인 교차 엔트로피 손실 사용).
개인화 기여도의 차이: 실제로는 응답의 각 토큰이 개인화에 기여하는 정도가 다릅니다. 예를 들어, 대화에서는 정보 전달 토큰이, 글쓰기 작업에서는 스타일적 토큰이 개인화에 더 중요한 역할을 합니다.
측정의 어려움: 어떤 토큰이 사용자의 특정 정보에 의존하는지 (개인화 정도가 높은지) 를 정량적으로 추정하는 명확한 지표가 부족했습니다.

이로 인해 중요한 개인화 토큰이 훈련 과정에서 약화되거나, 모델이 사용자의 고유한 특성을 반영하는 데 실패할 수 있습니다.

2. 방법론 (Methodology)

저자들은 토큰 수준에서 개인화 기여도를 추정하고 이를 훈련에 반영하기 위해 PerContrast와 PerCE Loss를 제안합니다.

A. PerContrast: 인과적 개입을 통한 개인화 정도 추정

각 토큰이 사용자 정보 (Persona) 에 얼마나 의존하는지를 측정하기 위해 인과적 개입 (Causal Intervention) 기법을 사용합니다.

자기 대조 (Self-Contrast): 주어진 응답 토큰 $y_i$ 에 대해, 전체 개인화 프롬프트 (사용자 정보 포함) 를 조건으로 했을 때의 확률과, 사용자 정보를 제거한 프롬프트를 조건으로 했을 때의 확률을 비교합니다.
PIR (Personal Influence Ratio): 두 로그 확률의 차이를 계산하여 토큰별 개인화 영향력을 정량화합니다.
$PIR(y_i) = \log P_\theta(y_i | \text{persona}, \text{query}) - \log P_\theta(y_i | \text{query})$
인과적 해석: 이 차이는 사용자 정보가 해당 토큰 예측에 미치는 인과적 효과 (Causal Effect) 를 의미하며, 이론적으로 증명되었습니다. PIR 값이 높을수록 해당 토큰은 개인화에 핵심적인 역할을 합니다.

B. PerCE Loss: 기대 - 최대화 (EM) 관점의 훈련

추정된 개인화 정도를 바탕으로 훈련 목표를 수정합니다.

가중 교차 엔트로피 (Weighted CE): 모든 토큰에 균일한 가중치를 주는 대신, PIR 로 추정된 중요도 가중치 $w(y_i)$ 를 곱하여 손실 함수를 정의합니다.
$\text{PerCE} = -\frac{1}{n} \sum_{i=1}^{n} w(y_i) \log P_\theta(y_i | \text{persona}, \text{query}, y_{<i})$
온라인 EM 루프:
1. E-step (추정): 현재 모델 파라미터로 PIR 을 계산하여 토큰별 개인화 중요도 가중치를 추정합니다.
2. M-step (최적화): 추정된 가중치를 사용하여 가중 교차 엔트로피 손실을 최소화하며 모델을 업데이트합니다.
이 과정은 추가적인 레이블링 없이 모델이 스스로 중요한 개인화 토큰을 식별하고 강화하는 부트스트래핑 (Bootstrapping) 메커니즘을 형성합니다.

3. 주요 기여 (Key Contributions)

토큰 수준 개인화 분석의 최초 시도: 개인화 작업에서 토큰마다 기여도가 다르다는 점을 체계적으로 분석하고, 이를 정량화하는 PerContrast를 제안했습니다.
PerCE Loss 개발: 인과적 이론에 기반하여 토큰 가중치를 동적으로 조정하는 새로운 손실 함수를 개발했습니다. 이는 기존 훈련 파이프라인과 직교 (Orthogonal) 하여 쉽게 통합 가능합니다.
광범위한 실험 검증: 다양한 모델 (Qwen3-4B/14B, Llama3-8B) 과 작업 (LongLaMP, ALOE, LaMP) 에서 PerCE 의 효과성을 입증했습니다.

4. 실험 결과 (Results)

LongLaMP (개인화된 긴 형식 텍스트 생성 벤치마크) 및 ALOE (다중 턴 대화) 데이터셋에서 수행된 실험 결과는 다음과 같습니다.

성능 향상: 표준 교차 엔트로피 (CE) 손실 대비 평균 10% 이상, 최대 68.04% 의 성능 향상 (METEOR 점수 기준) 을 기록했습니다. 특히 리뷰 작성 (PRW) 과 주제 작성 (PTW) 작업에서 큰 개선을 보였습니다.
교차 작업 및 교차 시나리오 전이 (Transferability):
- 한 작업 (예: 주제 작성) 으로 훈련된 모델이 다른 작업 (예: 요약 작성) 에 적용될 때도 CE 대비 월등히 좋은 성능을 보였습니다.
- 명시적인 사용자 정보가 없는 대화 시나리오 (ALOE) 로의 전이에서도 큰 성능 향상을 보이며, 모델이 대화 맥락에서 사용자 선호도를 추론하는 능력이 강화됨을 입증했습니다.
강건성 (Robustness): 학습률 (Learning Rate) 변화에 대해 CE 보다 훨씬 안정적인 성능을 보였습니다.
비용 효율성: 개인화 정보 제거를 위한 추가 순전파 (Forward Pass) 가 한 번 필요하지만, 이는 입력 길이의 약 7% 만을 처리하므로 계산 비용이 거의 증가하지 않습니다.

5. 의의 및 결론 (Significance)

이 논문은 LLM 개인화 분야에서 다음과 같은 중요한 통찰을 제공합니다.

패러다임의 전환: "모든 토큰은 동일하다"는 기존 가정을 깨고, 토큰 인식 (Token-aware) 훈련이 개인화 성능 향상의 핵심임을 증명했습니다.
간단하고 효과적인 접근: 복잡한 아키텍처 변경이나 추가 데이터 수집 없이, 기존 훈련 루프에 PerCE를 적용하는 것만으로도 개인화 능력을 극대화할 수 있음을 보였습니다.
미래 방향: 토큰 수준의 개인화 신호는 사용자 임베딩 학습, PEFT(파라미터 효율적 미세 조정) 등 개인화 파이프라인의 다른 단계에서도 중요한 지도 신호로 활용될 수 있는 잠재력을 가집니다.

결론적으로, 이 연구는 인과적 추론을 기반으로 토큰별 중요도를 동적으로 조정하는 PerCE를 통해, 적은 비용으로 대형 언어 모델의 개인화 성능과 일반화 능력을 획기적으로 개선하는 새로운 표준을 제시합니다.

Rethinking Personalization in Large Language Models at the Token Level

1. 문제: "모든 단어에 똑같은 점수를 매기면 안 돼요!"

2. 해결책 1 단계: "PerContrast" (개인화 감지기)

3. 해결책 2 단계: "PerCE" (핵심 단어 집중 훈련)

4. 왜 이것이 중요한가요? (결과)

5. 한 줄 요약

1. 문제 제기 (Problem)

2. 방법론 (Methodology)

A. PerContrast: 인과적 개입을 통한 개인화 정도 추정

B. PerCE Loss: 기대 - 최대화 (EM) 관점의 훈련

3. 주요 기여 (Key Contributions)

4. 실험 결과 (Results)

5. 의의 및 결론 (Significance)

유사한 논문

One Language, Two Scripts: Probing Script-Invariance in LLM Concept Representations

MultiGraSCCo: A Multilingual Anonymization Benchmark with Annotations of Personal Identifiers

ConFu: Contemplate the Future for Better Speculative Sampling

SciTaRC: Benchmarking QA on Scientific Tabular Data that Requires Language Reasoning and Complex Computation

Automated Thematic Analysis for Clinical Qualitative Data: Iterative Codebook Refinement with Full Provenance