Federated Learning and Unlearning for Recommendation with Personalized Data Sharing

이 논문은 사용자의 개인화된 데이터 공유 의사를 반영하고 공유된 데이터의 영향력을 제거할 수 있는 'FedShare'라는 새로운 연방 학습 및 언러닝 프레임워크를 제안하여, 기존 연방 추천 시스템의 한계를 극복하고 저장 오버헤드를 줄이면서 높은 추천 성능을 달성합니다.

Liang Qu, Jianxin Li, Wei Yuan, Shangfei Zheng, Lu Chen, Chengfei Liu, Hongzhi Yin

게시일 2026-03-13
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

1. 문제점: "모두에게 똑같은 규칙"의 한계

지금까지의 추천 시스템은 **"모든 사용자의 데이터는 절대 서버에 보내지 않는다"**는 원칙을 고수했습니다. 마치 모든 사람이 자신의 비밀 일기를 절대 남에게 보여주지 않는 것과 같습니다.

  • 장점: 개인정보가 안전합니다.
  • 단점: 하지만 시스템이 "너는 이걸 좋아할 거야"라고 추측할 수 있는 정보가 부족해서 추천이 별로 맞지 않을 수 있습니다.

또한, 만약 어떤 사용자가 "내 데이터를 조금만 보여줄게, 대신 더 좋은 추천을 해줘"라고 했다가 나중에 "아니야, 그거 지워줘!"라고 요청하면, 기존 시스템은 그 데이터를 완전히 잊어버리기 위해 시스템을 처음부터 다시 만들어야 (재학습) 했습니다. 이는 시간이 너무 오래 걸려 현실적으로 불가능합니다.

2. 해결책: FedShare (공유와 망각의 자유)

이 논문이 제안한 FedShare는 사용자에게 선택권을 줍니다.

🎁 1 단계: 맞춤형 데이터 공유 (학습 단계)

사용자는 자신의 데이터를 어떻게 공유할지 3 가지 중 하나를 선택할 수 있습니다.

  1. 전부 공유: "내 모든 취향을 다 보여줄게! 더 좋은 추천을 해줘!"
  2. 부분 공유: "비밀은 지키고 싶지만, 일부는 보여줄게."
  3. 아무것도 공유 안 함: "내 데이터는 내 손에 맡겨줘."

이 시스템은 데이터를 공유한 사용자들의 정보를 바탕으로 **거대한 '취향 지도'**를 서버에서 만듭니다.

  • 비유: 각자 자신의 집 (로컬 기기) 에 있는 장난감을 가지고 놀다가, 일부 장난감을 공동 놀이터 (서버) 에 가져와서 함께 놀면, 더 다양한 친구들을 만나고 더 재미있는 게임을 할 수 있는 것과 같습니다.
  • 핵심 기술: 서버는 이 거대한 지도를 보고, 각자의 집 (로컬) 에서 본 작은 지도와 비교하며 "이 장난감은 사실 저 친구랑도 잘 어울리네?"라고 더 정확한 연결고리를 찾아냅니다. 이를 통해 추천의 정확도가 크게 올라갑니다.

🗑️ 2 단계: 데이터 잊기 (Unlearning 단계)

사용자가 "아까 보여줬던 데이터는 이제 지워줘. 그리고 그 영향도 시스템에서 지워줘"라고 요청하면, FedShare 는 시스템을 처음부터 다시 만들지 않고 그 부분만 깔끔하게 지웁니다.

  • 기존 방식의 문제: 과거의 모든 학습 기록 (기울기 정보) 을 저장해 두어야 해서 메모리 (저장 공간) 를 엄청나게 많이 차지했습니다.
  • FedShare 의 방식: 서버는 과거의 '장난감 배치도 (임베딩)' 몇 가지만 간직해 둡니다.
    • 비유: 식당이 손님이 "이 메뉴는 이제 빼주세요"라고 하면, 전체 레시피를 다시 적지 않고, 그 메뉴가 들어갔던 과거의 주문 기록 몇 장만 보고 "아, 이 재료 조합은 이제 안 쓰네"라고 기억을 지우는 것과 같습니다.
    • 효과: 저장 공간을 거의 차지하지 않으면서도, 시스템이 그 데이터를 '잊은' 것처럼 행동하게 만듭니다.

3. 왜 이 기술이 중요한가요?

  1. 개인 맞춤 자유: "비밀은 지키고 싶지만, 좋은 추천은 받고 싶다"는 사용자의 모순된 욕구를 해결해 줍니다.
  2. 잊혀질 권리 (Right to be Forgotten): 유럽의 GDPR 같은 법규처럼, 사용자가 원하면 자신의 데이터와 그 영향력을 완전히 지울 수 있게 해줍니다.
  3. 효율성: 시스템을 처음부터 다시 만들지 않아도 되므로 시간과 비용이 절약됩니다.

4. 요약

이 논문은 **"우리가 원하는 만큼만 데이터를 공유하고, 원하면 언제든지 그 데이터를 잊게 할 수 있는 똑똑한 추천 시스템"**을 만들었습니다.

  • 공유할 때: 서로의 취향을 공유해서 더 똑똑한 지도를 만들고,
  • 잊을 때: 시스템의 메모리를 많이 쓰지 않으면서 그 데이터를 깔끔하게 지워버립니다.

이 기술은 앞으로 우리가 더 안전하면서도 더 만족스러운 추천 서비스를 받을 수 있게 해줄 것입니다.