DiSRouter: Distributed Self-Routing for LLM Selections

이 논문은 다양한 LLM 의 성능과 비용 균형을 위해 중앙 집중식 라우팅의 한계를 극복하고, 각 에이전트의 자기 인식 능력을 기반으로 한 분산형 자기 라우팅 시스템인 'DiSRouter'를 제안하며, 이를 통해 기존 방법보다 뛰어난 유연성과 일반화 성능을 입증했습니다.

Hang Zheng, Hongshen Xu, Yongkai Lin, Shuai Fan, Lu Chen, Kai Yu

게시일 2026-03-03
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🚀 디스루터 (DiSRouter): 지능형 AI 팀의 '스스로 판단하는' 새로운 리더십

이 논문은 **"어떤 질문을 어떤 AI 가 답해야 할지, 중앙의 지시자가 아니라 각 AI 가 스스로 판단하게 하자"**는 혁신적인 아이디어를 제시합니다. 이를 **DiSRouter(분산형 자기-라우터)**라고 부릅니다.

기존 방식과 새로운 방식을 쉽게 비유해서 설명해 드릴게요.


1. 문제: "모든 일을 한 명의 지휘관이 결정하는 것의 한계"

지금까지의 AI 시스템은 **중앙 집중식 (Centralized)**이었습니다.

  • 비유: 거대한 회사에서 모든 업무 지시는 오직 **단 한 명의 '팀장'**만 합니다.
    • 팀장은 "이건 A 직원이 할 수 있겠네, B 직원은 너무 어렵겠네"라고 판단해서 업무를 배정합니다.
  • 문제점:
    1. 유연성 부족: 새로운 직원이 들어오면 팀장은 다시 모든 것을 배워야 합니다. (시스템을 다시 훈련해야 함)
    2. 판단 오류: 팀장 (작은 AI) 이 모든 직원의 능력 한계를 완벽하게 알 수 없습니다. "아, 이거 B 가 할 수 있겠구나"라고 생각했는데, B 가 실패하는 경우가 생깁니다.
    3. 비효율: 팀장이 판단하는 데 시간이 걸리고, 팀장 자체가 병목 현상이 됩니다.

2. 해결책: "스스로 판단하는 AI 팀원들 (DiSRouter)"

이 논문이 제안하는 DiSRouter는 중앙의 팀장을 없애고, 모든 직원이 스스로 판단하게 합니다.

  • 비유: 이제 모든 직원이 '자기 능력'을 잘 아는 전문가가 되었습니다.
    • 작은 직원 (저렴한 AI): "이 질문은 내가 쉽게 풀 수 있겠다!" → 바로 답함.
    • 중간 직원: "어? 이 질문은 내가 잘 모르겠는데... 내 능력 밖이야." → 스스로 거절하고 ("I don't know"), 더 큰 능력의 동료에게 넘김.
    • 큰 직원 (비싼 AI): "이건 내가 해결할 수 있어." → 답함.

이 과정은 **계단식 (Cascade)**으로 이루어집니다. 질문은 가장 작은 AI 에서 시작해, 스스로 해결할 수 없으면 다음으로 큰 AI 로 넘어갑니다.

3. 핵심 기술: "자기 인식 훈련 (Self-Awareness Training)"

그런데 AI 가 "내가 이거 못 해"라고 말하는 게 정말 가능할까요? 보통 AI 는 모르는 것도 억지로 답하려 합니다. 그래서 연구팀은 AI 에게 두 단계의 훈련을 시켰습니다.

  1. SFT (지도 학습): "정답을 모르는 질문에는 '모르겠다'라고 솔직하게 말해라"라고 가르쳤습니다.
  2. RL (강화 학습): 상황에 따라 행동을 조절하게 했습니다.
    • 성능 우선 모드: "무조건 정확해야 해! 조금이라도 의심되면 넘겨버려!" (실수 방지)
    • 비용 우선 모드: "비용을 아껴야 해! 내가 할 수 있을 것 같으면 일단 해봐!" (비용 절감)

이 훈련을 통해 각 AI 는 **자신의 지식의 한계 (Knowledge Boundary)**를 정확히 알게 되었습니다.

4. 왜 이것이 더 좋은가요? (장점)

  • 🧩 레고 블록처럼 유연함 (Modularity): 새로운 AI 모델을 팀에 추가하고 싶다면, 기존 시스템을 다 고칠 필요 없이 그 AI 만 훈련하면 됩니다. 바로 끼워 넣으면 됩니다.
  • 🌍 어디든 잘 적응함 (Generalization): 훈련받지 않은 새로운 분야의 질문이 들어와도, 각 AI 가 "이건 내 영역이 아니야"라고 판단해서 적절한 사람에게 넘겨줍니다.
  • 💰 비용과 성능의 완벽한 균형: 쉬운 질문은 저렴한 AI 가, 어려운 질문은 비싼 AI 가 처리하므로 전체 비용은 줄이면서 정확도는 높입니다.

5. 결론: "중앙 통제보다 '스스로 아는 것'이 더 강력하다"

이 연구는 **"작은 AI 가 큰 AI 의 능력을 판단하는 것보다, 각 AI 가 자신의 능력을 스스로 판단하는 것이 훨씬 정확하고 효율적"**임을 증명했습니다.

마치 중앙 지휘관 하나에 의존하는 군대보다, 각 병사가 전황을 보고 스스로 판단하고 행동하는 특수부대가 더 빠르고 유연한 것과 같습니다. DiSRouter 는 이렇게 각 AI 가 스스로 책임지는 분산형 지능 시스템의 새로운 시대를 열었습니다.


한 줄 요약:

"모든 일을 지시하는 '팀장'을 없애고, 각 AI 가 '내가 이거 할 수 있나?'를 스스로 판단하여 가장 적합한 AI 가 답하게 만든, 훨씬 똑똑하고 저렴한 시스템입니다!"