Menu Pricing of Large Language Models

이 논문은 LLM 제공자가 다양한 작업 가치를 가진 사용자에게 최적의 토큰 예산 메뉴를 설계하는 이론적 프레임워크를 제시하며, 이 모델이 Anthropic, OpenAI 등 주요 기업의 실제 가격 정책과 어떻게 부합하는지를 분석합니다.

Dirk Bergemann, Alessandro Bonatti, Alex Smolin

게시일 2026-03-10
📖 4 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"거대 언어 모델 (LLM, 예: 챗봇) 을 어떻게 가장 효과적으로 팔아야 할까?"**라는 질문에 대한 경제학적 해답을 제시합니다.

마치 **"AI 가 제공하는 계산 능력 (토큰) 을 어떻게 가격 책정하고 메뉴를 구성해야 돈을 가장 많이 벌면서도 고객도 만족시킬까?"**를 고민하는 연구입니다.

이 복잡한 수학적 논문을 일상적인 비유로 쉽게 설명해 드릴게요.


1. 핵심 문제: "모든 고객의 사용법이 다 다른데, 어떻게 가격을 매길까?"

생각해 보세요. 어떤 고객이 AI 를 쓰는지 알 수 없습니다.

  • 고객 A는 짧은 질문만 하고 끝내지만, 아주 중요한 법적 문서 작성에 씁니다. (가치 높음, 사용량 적음)
  • 고객 B는 아주 간단한 질문을 수천 번 합니다. (가치 낮음, 사용량 많음)
  • 고객 C는 복잡한 코딩 작업을 위해 긴 대화를 나눕니다.

판매자 (OpenAI, Anthropic 등) 는 "누가 무엇을 얼마나 쓸지" 모릅니다. 하지만 고객이 토큰 (문자 단위) 을 얼마나 쓸지는 측정할 수 있습니다.

이 논문은 **"고객의 복잡한 사용 패턴을 하나의 숫자 (지수) 로 요약할 수 있다"**는 놀라운 사실을 발견했습니다. 마치 여러 가지 재료를 섞어 만든 요리처럼, 고객이 어떤 일을 하든 결국 **"얼마나 많은 '요리 재료' (토큰) 를 썼는지"**만 보면 그 고객의 가치를 알 수 있다는 것입니다.

2. 해결책: "요리 재료 키트 (Budget) 판매"

이제 판매자는 복잡한 고객 유형을 일일이 분석할 필요가 없습니다. 대신 **"토큰 예산 (Budget)"**을 파는 메뉴를 만들면 됩니다.

비유: "스마트폰 데이터 요금제"

우리가 스마트폰을 쓸 때, "오늘 뉴스는 10MB, 유튜브는 500MB"라고 따로 계약하지 않죠. 대신 **"월 10GB 데이터"**라는 예산을 사고, 그 안에서 원하는 대로 씁니다.

이 논문이 제안하는 최적의 가격 정책도 비슷합니다:

  1. 예산 (Budget) 을 팝니다: 고객이 "이번 달에 토큰 100 만 개 쓸 수 있는 권한"을 구매합니다.
  2. 단가는 정해져 있습니다: 토큰 한 개당 가격은 고정되어 있습니다 (예: 입력 토큰 10 원, 출력 토큰 20 원).
  3. 고객이 자유롭게 배분합니다: 고객은 이 예산 안에서 "법률 문서 작성에 80% 를 쓰고, 간단한 채팅에 20% 를 쓰는가"를 스스로 결정합니다.

왜 이것이 최선일까요?

  • 저가 고객: 예산이 적고, 토큰 단가가 비싸게 책정된 요금제를 선택합니다.
  • 고가 고객: 예산이 많고, 토큰 단가가 상대적으로 저렴해지는 (할인받는) 요금제를 선택합니다.
  • 결과: 판매자는 고객의 숨겨진 가치를 정확히 캐내어 (가격 차별화) 수익을 극대화하면서도, 고객은 자신이 원하는 대로 AI 를 자유롭게 쓸 수 있습니다.

3. 현실의 사례: "Anthropic vs OpenAI"

이론이 실제로 어떻게 적용되는지 논문은 두 회사의 예를 들어 설명합니다.

  • Anthropic (클로드):

    • 전략: "모델은 똑같은데, **사용량 (예산)**만 다르게 주세요."
    • 비유: 같은 식당에서 메뉴는 똑같지만, "소량 세트", "중량 세트", "대량 세트"만 다르게 파는 것과 같습니다.
    • 이론적 의미: 이 논문 4 장의 '단일 모델' 이론과 정확히 일치합니다.
  • OpenAI (챗 GPT):

    • 전략: "비싼 요금제를 쓰면 더 똑똑한 모델을 쓸 수 있어요."
    • 비유: 일반 좌석은 기본 메뉴만 나오고, VIP 좌석은 '특급 요리'를 내주는 것과 같습니다.
    • 이론적 의미: 이 논문 5 장의 '다중 모델' 이론과 일치합니다. 더 똑똑한 모델은 '고급 요리 재료'이므로, 더 많은 돈을 쓰는 고객에게만 제공해야 합니다.

4. 경쟁의 힘: "무료 버전 (오픈소스) 이 있을 때"

만약 시장에 **무료로 토큰을 주는 경쟁자 (오픈소스 모델)**가 있다면 어떨까요?

  • 가벼운 사용자: 무료 경쟁자를 이용합니다. (판매자는 이들을 잡을 수 없음)
  • 중간 사용자: 판매자는 "무료로 쓸까, 아니면 우리 돈을 내고 쓸까?" 고민하게 됩니다. 그래서 판매자는 중간 고객에게 딱 필요한 만큼의 예산을 주어, 경쟁자를 쓰지 못하게 막습니다. (이론적 용어: '방어적 공급')
  • 무거운 사용자: 아예 경쟁자를 무시하고 비싼 유료 모델을 씁니다.

이처럼 경쟁은 판매자가 **누구를 대상으로 팔지 (확장적 한계)**와 **얼마나 많이 팔지 (집약적 한계)**를 모두 바꾸게 만든다는 것을 보여줍니다.

5. 결론: "왜 API 는 토큰당 단가만 받을까?"

개발자들이 쓰는 API(프로그램 연결용) 는 왜 복잡한 요금제가 아니라 "사용한 만큼만 내는 (Pay-per-token)" 방식일까요?

  • 이유: 개발자 시장은 아직 성장 단계입니다. 판매자들은 지금 당장 이윤을 다 챙기기보다, **더 많은 개발자가 우리 기술을 쓰게 만드는 것 (시장 점유율)**이 더 중요합니다.
  • 비유: 새로운 카페가 오픈할 때, "한 잔 사면 다음 건 50% 할인" 같은 복잡한 쿠폰을 주기보다, "모든 커피를 시중가보다 조금 저렴하게" 팔며 손님을 모으는 것과 같습니다.

요약: 이 논문이 우리에게 알려주는 것

  1. 복잡한 고객을 단순화하라: 고객의 복잡한 사용 패턴을 '총 사용량 (예산)' 하나로 요약하면 가격 책정이 쉬워집니다.
  2. 예산 (Budget) 을 팔아라: 토큰 개수를 따로따로 팔지 말고, "월 100 만 토큰 사용권"처럼 예산 단위로 파는 것이 가장 효율적입니다.
  3. 현실은 이론을 따른다: 우리가 매일 보는 AI 요금제 (OpenAI, Anthropic, Poe 등) 는 이 복잡한 수학적 이론이 현실에서 완벽하게 작동하고 있다는 증거입니다.

결국 이 논문은 **"AI 를 팔 때는 복잡한 규칙을 만들지 말고, 고객이 자유롭게 쓸 수 있는 '예산'을 제공하고, 그 안에서 자연스럽게 가격을 차별화하라"**는 현명한 조언을 줍니다.