Menu Pricing of Large Language Models

该论文构建了一个大语言模型最优定价与产品设计的理论框架,证明在异质用户场景下,高维类型可简化为标量指数,从而导出承诺消费合约等最优机制,并解释了当前主流模型提供商的定价实践及竞争效应。

Dirk Bergemann, Alessandro Bonatti, Alex Smolin

发布于 2026-03-10
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文探讨了一个非常现代且重要的问题:如何给大语言模型(LLM,比如 ChatGPT、Claude)制定最赚钱且合理的定价策略?

想象一下,你是一家卖“超级大脑”(AI 模型)的老板。你的客户有成千上万种不同的需求:有的只是写个简单的邮件,有的要写复杂的代码,有的要分析法律文件。每个客户对“大脑算力”的渴望程度不同,而且他们自己最清楚自己需要多少算力,但你作为老板却看不透。

这就好比你要卖一种**“万能燃料”**,但客户既不想按“升”买(因为不知道要用多少),也不想按“次数”买(因为每次任务难度不同)。

这篇论文的核心发现是:虽然看起来这个问题极其复杂(像一团乱麻),但其实有一个简单的“魔法钥匙”能解开它。

以下是用通俗语言和比喻对论文核心内容的解读:

1. 核心难题:看不见的“任务地图”

  • 现实情况:每个用户脑子里都有一张“任务地图”。有的用户只有一两个高价值任务(比如只用来写代码),有的用户有成千上万个低价值任务(比如用来闲聊)。
  • 困难点:作为卖家,你只能看到用户用了多少“令牌”(Token,即 AI 生成的字数),但你不知道这些令牌具体用在了哪些任务上。用户可能会把昂贵的算力用在简单的任务上,或者把便宜的算力用在复杂的任务上。这就产生了“信息不对称”和“道德风险”。
  • 比喻:就像你开了一家**“自助餐厅”**,顾客可以随便吃。但你不知道顾客是为了填饱肚子(简单任务)还是为了尝遍珍馐(复杂任务)。如果你定价太高,简单吃饭的人跑了;定价太低,吃大餐的人占了便宜,你亏本。

2. 魔法钥匙:把“复杂”压缩成“一个数字”

论文最惊人的发现是:虽然用户的任务千差万别,但在数学上,所有用户的复杂需求可以被压缩成一个简单的“总指数”(Aggregate Type)。

  • 比喻:想象每个用户手里都拿着一袋不同重量的“金币”(代表他们对不同任务的价值)。虽然金币的分布不同(有的用户金币集中在少数几个任务,有的分散在无数任务),但只要金币的总重量(总指数)一样,他们消耗算力的方式和获得的满足感就是一样的。
  • 结论:卖家不需要去管用户具体在做什么任务,只需要根据这个“总指数”来卖货。这就像把成千上万种不同的菜单,简化成了**“按总食量收费”**。

3. 最优定价策略:三种“套餐”形式

既然知道了用户只看“总食量”,论文提出了三种最赚钱的卖法,而且这些方法在现实中已经存在了:

A. “预算封顶”模式(Maximum-Spend)

  • 机制:用户付一笔钱,获得一个“积分包”(比如 100 万积分)。每次使用 AI,根据任务的难度扣除不同数量的积分。一旦积分用完,服务就停止,直到下个月。
  • 比喻:就像**“自助餐券”**。你付了 200 元,可以随便吃,但如果你吃得太撑(用了太多算力),餐厅就关门了。
  • 现实案例Quora 的 Poe。用户买月费,获得“点数”,不同模型扣点数不同,点数用完即止。

B. “保底消费”模式(Minimum-Spend)

  • 机制:用户承诺每月至少消费多少钱。如果没花够,也要付保底费;如果花超了,超出部分按单价算,但单价可能更便宜。
  • 比喻:就像**“手机套餐”**。你承诺每月至少花 100 元,如果用了 150 元,多出的 50 元按标准价算;如果只用了 80 元,你也得付 100 元。
  • 现实案例GitHub Copilot。开发者付月费,有一定额度的高级请求,用超了可以按次付费。

C. “分级订阅”模式(按模型能力分级)

  • 机制:不仅卖“量”,还卖“质”。便宜的套餐只能用普通模型,贵的套餐才能用“超级大脑”(推理能力更强的模型)。
  • 比喻:就像**“电影院”**。普通票只能看普通厅,VIP 票才能看 IMAX 厅。
  • 现实案例OpenAI (ChatGPT)。免费/Plus 版只能用基础模型,Pro 版($200/月)才能独家使用最强的 o1 推理模型。

4. 竞争的影响:当“开源”小厂出现时

论文还研究了当有一个“巨头”(专有模型)和一个“小贩”(开源模型,按成本价卖)竞争时会发生什么。

  • 低需求用户:直接去小贩那里买,因为便宜。
  • 中等需求用户:巨头会设计一种“刚好够用”的套餐,让用户觉得“去小贩那里补货太麻烦/不划算”,从而把用户留在巨头这里。这叫**“阻吓策略”**。
  • 高需求用户:巨头直接按垄断价格卖给他们,因为这些人离不开巨头的高级功能。
  • 比喻:就像**“星巴克”和“路边摊”**。
    • 只想喝杯水的(低需求):去路边摊。
    • 想喝拿铁的(中需求):星巴克推出“买一送一”或“会员日”,让你觉得去路边摊买咖啡豆自己煮太麻烦,于是留在星巴克。
    • 想喝特调咖啡的(高需求):星巴克直接卖高价,反正你离不开它。

5. 为什么 API 接口是“按字收费”?

你可能会问,为什么开发者用的 API 接口(比如程序员调用 AI)是简单的“按输入/输出字数收费”,没有复杂的套餐?

  • 原因:论文指出,在开发者市场,厂商的首要目标是**“抢占市场”“培养习惯”**,而不是榨取最大利润。
  • 比喻:这就像**“自来水公司”**在推广期。为了让你习惯用水,他们不跟你玩复杂的套餐游戏,直接按吨收费,甚至价格定得比成本略高一点点,但保证你随时能用。这种简单的线性定价,在数学上被证明是“受约束下的最优解”。

总结

这篇论文告诉我们,AI 定价看起来乱糟糟的,其实背后有一套严密的数学逻辑:

  1. 化繁为简:不管用户多复杂,只看他们的“总价值指数”。
  2. 灵活变现:通过“预算包”、“保底消费”和“模型分级”这三种方式,把复杂的算力资源卖得明明白白。
  3. 现实印证:Anthropic、OpenAI、GitHub 等巨头的定价策略,竟然和几十年前的经济学理论完美吻合。

简单来说,卖 AI 就像卖水,但用户 thirsty(口渴)的程度和方式各不相同。最好的办法不是给每个人量体温,而是给他们发一张“水票”,让他们自己决定喝多少、喝什么档次的水。