Neural Thickets: Diverse Task Experts Are Dense Around Pretrained Weights

이 논문은 대규모 사전 학습 모델의 가중치 주변에 다양한 작업 전문가들이 밀집해 있음을 발견하고, 이를 바탕으로 단순한 무작위 섭동 샘플링과 다수결 투표만으로 PPO 나 GRPO 와 같은 표준 미세 조정 방법과 경쟁력 있는 성능을 달성하는 새로운 병렬 후학습 기법을 제안합니다.

Yulu Gan, Phillip Isola

게시일 2026-03-13
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

1. 기존 방식: "바늘 찾기" (Needle in a Haystack)

과거의 AI 학습 방식은 마치 건초더미 속에서 바늘을 찾는 것과 같았습니다.

  • 상황: AI 모델이 아직 충분히 훈련되지 않았을 때 (작은 모델), 원하는 답을 주는 해법은 그 주변에 아주 드물게 존재합니다.
  • 방법: 그래서 우리는 AI 를 가르치기 위해 **경사하강법 (Gradient Descent)**이라는 복잡한 나침반을 들고, 하나하나씩 천천히, 정교하게 길을 찾아야 했습니다. 실수하면 다시 돌아가고, 다시 찾고 하는 과정이 필요했죠.

2. 새로운 발견: "신경 덤불" (Neural Thickets)

하지만 연구자들은 거대하고 잘 훈련된 AI 모델을 분석하다가 놀라운 사실을 발견했습니다.

  • 상황: AI 모델이 충분히 커지고 (예: 70 억 개 이상의 파라미터), 다양한 것을 배운 후에는, 주변에 **해답이 아주 빽빽하게 모여 있는 숲 (덤불)**이 생깁니다.
  • 비유: 건초더미가 아니라, 수천 개의 보물 상자가 무작위로 흩어져 있는 넓은 숲에 들어선 것과 같습니다.
  • 발견: 이 숲에서는 "정답"을 찾기 위해 복잡한 나침반이 필요 없습니다. 눈을 감고 무작위로 한 발짝만 내딛어도, 이미 훌륭한 해답 (전문가) 을 만날 확률이 매우 높습니다.

3. 핵심 아이디어: "랜덤 추측 + 팀워크" (RandOpt)

이 논문의 저자들은 이 사실을 이용해 아주 간단하지만 강력한 방법을 고안했습니다. 이를 RandOpt라고 부릅니다.

  1. 무작위 추측 (Random Guessing):

    • AI 의 두뇌 (가중치) 를 아주 살짝, 무작위로 흔들어 봅니다. (예: 5,000 번)
    • 마치 숲에서 5,000 명의 탐험가를 보내서 "너희는 각각 다른 길을 가봐"라고 하는 것과 같습니다.
    • 놀랍게도, 이 중 상당수가 원래 AI 보다 특정 문제 (수학, 코딩, 글쓰기 등) 를 더 잘 풀고 있었습니다.
  2. 전문가들의 팀워크 (Ensembling):

    • 여기서 중요한 점은, 각 탐험가가 모든 문제를 잘 푸는 만능 천재가 아니라, 특정 분야의 전문가라는 것입니다.
    • A 는 수학은 잘하지만 코딩은 못 하고, B 는 코딩은 잘하지만 글쓰기는 못 합니다.
    • 그래서 가장 잘한 50 명의 전문가를 뽑아서, 그들이 답을 내는 방식을 모두 모아 (팀워크) 최종 정답을 냅니다. (다수결 투표 방식)

4. 왜 이것이 중요한가요?

  • 속도: 기존의 복잡한 학습 방식은 수천 번의 단계를 거치며 하나씩 수정해야 했지만, 이 방법은 한 번에 병렬로 5,000 개의 시도를 하고 가장 좋은 것만 고르면 됩니다. 마치 5,000 명의 직원이 동시에 일을 하고, 가장 잘한 사람 50 명만 뽑는 것과 같습니다.
  • 효율성: 컴퓨터 연산 비용 (FLOPs) 을 아끼면서도, 기존에 가장 성능이 좋다고 알려진 복잡한 학습법 (PPO, GRPO 등) 과 맞먹거나 더 좋은 결과를 냅니다.
  • 진실: AI 는 이미 "배운 것"을 가지고 있었습니다. 우리가 해야 할 일은 새로운 것을 가르치는 게 아니라, 이미 숨어 있던 다양한 전문가들을 찾아내어 팀으로 묶어주는 것이었습니다.

5. 한 줄 요약

"거대 AI 는 이미 답을 알고 있습니다. 다만 그 답이 숲속에 숨어 있을 뿐이죠. 우리는 복잡한 나침반 대신, 무작위로 숲을 수색하고 최고의 전문가들을 모아 팀을 꾸리면, 훨씬 빠르고 쉽게 AI 를 더 똑똑하게 만들 수 있습니다."

이 연구는 AI 개발의 패러다임을 "AI 를 새로 가르치는 것"에서 "AI 가 가진 잠재력을 찾아내는 것"으로 바꾸는 중요한 통찰을 제공합니다.