Menu Pricing of Large Language Models

Este artigo desenvolve um quadro teórico para a precificação ótima de menus de orçamentos de tokens por provedores de Modelos de Linguagem de Grande Escala (LLMs), demonstrando que a heterogeneidade dos usuários pode ser resumida em um índice escalar que leva a contratos de gasto comprometido, cujas previsões teóricas encontram correspondência direta nas práticas de mercado observadas em empresas como OpenAI e Anthropic.

Dirk Bergemann, Alessandro Bonatti, Alex Smolin

Publicado 2026-03-10
📖 5 min de leitura🧠 Leitura aprofundada

Each language version is independently generated for its own context, not a direct translation.

Imagine que você é o dono de uma pizzaria futurista chamada "IA". Você não vende apenas pizzas; você vende "inteligência" para resolver problemas.

Alguns clientes querem apenas uma fatia de queijo para o jantar (uma tarefa simples). Outros querem uma pizza gigante, recheada com ingredientes exóticos, para alimentar uma festa inteira (uma tarefa complexa). E alguns querem criar uma receita nova do zero (ajustar a IA).

O grande dilema do artigo é: Como cobrar o preço certo de cada cliente, se você não sabe exatamente o que eles vão fazer com a pizza?

Aqui está a explicação do artigo, traduzida para a vida real:

1. O Problema: O Cliente Escondido

O dono da pizzaria (a empresa de IA, como OpenAI ou Anthropic) sabe que os clientes são diferentes.

  • O Cliente A usa a IA para escrever e-mails rápidos.
  • O Cliente B usa a IA para analisar milhares de documentos jurídicos.
  • O Cliente C usa a IA para programar um jogo inteiro.

O problema é que o dono da pizzaria não pode ver o que o cliente está fazendo. Ele só vê o cliente pedindo "ingredientes" (chamados de tokens). Se o cliente pede 100 ingredientes, será que ele vai fazer 100 pizzas pequenas ou 1 pizza gigante?

Se o dono cobrar um preço fixo por pizza, o cliente que faz 100 pizzas pequenas vai pagar muito pouco. Se cobrar por ingrediente, o cliente que faz 1 pizza gigante pode achar caro demais. É um caos de preços!

2. A Grande Descoberta: O "Índice de Fome"

Os autores do artigo descobriram uma mágica matemática. Eles provaram que, não importa como o cliente usa a inteligência (se é para escrever, desenhar ou codificar), tudo isso pode ser resumido em uma única coisa: o "Índice de Fome" do cliente.

Pense assim:

  • Um cliente que quer 100 tarefas pequenas tem a mesma "fome total" que um cliente que quer 1 tarefa enorme, desde que a quantidade total de ingredientes seja a mesma.
  • A tecnologia da IA é tão flexível que, se você der ao cliente um orçamento de ingredientes, ele vai distribuir esses ingredientes da maneira mais eficiente possível, sozinho.

Isso transforma um problema super complexo (milhares de tipos de clientes) em algo simples: vender orçamentos de ingredientes.

3. A Solução: O "Cartão de Crédito de IA"

Em vez de vender "100 fatias de pizza" ou "100 páginas de texto", a empresa ideal deveria vender créditos.

Imagine que a empresa oferece três planos:

  1. Plano Básico: Você paga R$ 20 e ganha 1.000 créditos. Cada "fatia de pizza" (tarefa simples) custa 1 crédito. Cada "pizza gigante" (tarefa complexa) custa 50 créditos.
  2. Plano Pro: Você paga R$ 100 e ganha 6.000 créditos.
  3. Plano Elite: Você paga R$ 200 e ganha 20.000 créditos.

A mágica: O cliente decide como gastar os créditos. Se ele tem muitas tarefas pequenas, ele gasta devagar. Se tem uma tarefa gigante, ele gasta rápido.

  • Para a empresa: É perfeito. Ela sabe que quem tem mais dinheiro (e mais tarefas) vai comprar o plano maior.
  • Para o cliente: É justo. Ele só paga pelo que usa, mas ganha um desconto por comprar o pacote grande (como comprar um combo de pizza).

4. Como isso funciona na vida real?

O artigo mostra que as empresas de IA que você conhece já estão fazendo isso, mesmo sem saber a teoria matemática!

  • Anthropic (Claude): Eles vendem assinaturas onde você tem um limite de mensagens. Se você usa um modelo mais inteligente (que "come" mais ingredientes), suas mensagens acabam mais rápido. É como vender um "pote de ingredientes" onde o tamanho da pizza define o preço.
  • OpenAI (ChatGPT): Eles fazem algo parecido, mas também bloqueiam os modelos mais potentes apenas para quem paga mais caro. É como ter uma "pizza especial" que só entra no plano mais caro.
  • GitHub Copilot: Funciona como um "cartão de crédito". Você paga uma mensalidade e tem um limite de "pedidos". Se passar do limite, pode continuar usando, mas paga por uso extra.

5. A Concorrência: O Mercado de Rua

O artigo também fala sobre o que acontece quando existe um "mercado de rua" (modelos de código aberto, gratuitos ou baratos).

  • Se o dono da pizzaria cobrar muito caro, os clientes vão para o mercado de rua comprar ingredientes baratos.
  • Para competir, o dono da pizzaria precisa oferecer um "pacote" tão bom que valha a pena pagar mais.
  • Resultado: Os clientes com "fome" pequena vão para o mercado de rua. Os clientes com "fome" média compram do dono da pizzaria para não ter que ir ao mercado. E os clientes com "fome" gigante (empresas grandes) compram o pacote premium, porque o mercado de rua não tem ingredientes suficientes para eles.

Resumo Final

O artigo diz que não precisamos de preços confusos e cheios de letras miúdas.

A melhor forma de vender Inteligência Artificial é vender orçamentos flexíveis.

  1. Dê ao cliente um "cartão de crédito" de tokens (ingredientes).
  2. Deixe ele gastar como quiser (em tarefas grandes ou pequenas).
  3. Cobrar um preço fixo pelo cartão, com descontos para quem compra cartões maiores.

Isso funciona porque a tecnologia da IA é tão poderosa que o cliente sabe exatamente como usar os ingredientes para fazer o melhor trabalho possível. A empresa só precisa garantir que o cliente tenha ingredientes suficientes e pagar o preço justo pelo tamanho da "fome" dele.

Em uma frase: Não venda "acesso à IA". Venda "ingredientes" e deixe o cliente cozinhar o que ele quiser, cobrando pelo tamanho do prato que ele consegue servir.