Menu Pricing of Large Language Models

Il paper sviluppa un quadro teorico che dimostra come la profilazione multidimensionale degli utenti di modelli linguistici possa essere ridotta a un indice scalare, portando a meccanismi di prezzo ottimali basati su budget di token e contratti di spesa impegnata che rispecchiano le pratiche attuali di provider come OpenAI e Anthropic.

Dirk Bergemann, Alessandro Bonatti, Alex Smolin

Pubblicato 2026-03-10
📖 5 min di lettura🧠 Approfondimento

Each language version is independently generated for its own context, not a direct translation.

Immagina di essere il proprietario di una pizzeria magica. Non è una pizzeria normale: la tua pizza può adattarsi istantaneamente a qualsiasi gusto, da quella per un bambino che vuole solo formaggio a quella per un gourmet che cerca ingredienti esotici. Questa pizzeria è un Modello Linguistico Intelligente (LLM) come ChatGPT o Claude.

Il problema? Non sai quanto fame abbiano i tuoi clienti prima che arrivino, né quanto siano esigenti. Alcuni vogliono solo un assaggio, altri vorrebbero mangiare l'intera cucina. Inoltre, non puoi controllare cosa mangiano esattamente, solo quanto pagano.

Questo articolo di Dirk Bergemann, Alessandro Bonatti e Alex Smolin è come una ricetta segreta per capire come questa pizzeria dovrebbe vendere le sue pizze per guadagnare il massimo, senza spaventare i clienti o regalare troppo.

Ecco i concetti chiave spiegati in modo semplice:

1. Il "Conto alla Spesa" invece del "Menu Fisso"

Nella vita reale, le aziende di intelligenza artificiale vendono i loro servizi in modi confusi: abbonamenti mensili, pagamento a "token" (pezzi di testo), o crediti. Gli autori dicono: "Fermiamoci e pensiamo alla logica".

Hanno scoperto che, nonostante ogni cliente abbia esigenze diverse (alcuni scrivono codice, altri scrivono poesie), si può riassumere tutto in un unico numero magico: la "fame totale" del cliente.

  • L'analogia: Immagina che invece di vendere "3 pizze margherita e 2 di peperoni", tu venda un buono spesa di 50 euro. Il cliente può spendere questi 50 euro come vuole: 10 pizze piccole o 2 pizze giganti.
  • La scoperta: Il modo migliore per vendere non è dire "tu hai diritto a 100 parole", ma dire "ecco un budget di 100 crediti, spendili come vuoi". Questo trasforma un problema complicatissimo (migliaia di gusti diversi) in un problema semplice (quanto è grande il tuo budget?).

2. I Tre Modi per Vendere (e come le aziende lo fanno già)

Gli autori mostrano che ci sono tre modi principali per strutturare questi "buoni spesa", e tutti e tre li vediamo già usati oggi:

  • Il "Tetto Massimo" (Maximum Spend):
    • Cos'è: "Paga 20€ al mese e hai diritto a spendere fino a 1 milione di crediti. Se li finisci, stop. Niente extra."
    • Esempio reale: Quora Poe. Ti danno un certo numero di "punti" al mese. Se li usi tutti, non puoi più usare l'IA finché non ricomincia il mese. È come un buffet a prezzo fisso: se mangi troppo, non ti danno altro.
  • Il "Sconto per Impegno" (Minimum Spend):
    • Cos'è: "Paga 20€ al mese per avere accesso, ma se superi il tuo limite, paghi un po' di più per ogni parola extra."
    • Esempio reale: GitHub Copilot. Ti dà un certo numero di richieste "premium" al mese. Se le finisci, puoi continuare a usarlo pagando una tariffa oraria aggiuntiva. È come un abbonamento telefonico con scatti a consumo dopo la soglia.
  • Il "Prezzo Lineare" (API per Sviluppatori):
    • Cos'è: "Non c'è abbonamento. Paghi solo per quello che usi, esattamente al costo di produzione."
    • Esempio reale: Le API di OpenAI o Google per gli sviluppatori. È come comprare la farina e il pomodoro al mercato: paghi solo ciò che porti a casa. Le aziende fanno così per attirare più clienti, anche se guadagnano meno per singolo utente.

3. La Gerarchia dei Modelli (Piccoli vs. Giganti)

Oggi le aziende offrono diversi modelli: uno veloce e "stupido" (per cose semplici) e uno lento e "genio" (per ragionamenti complessi).

  • La strategia: Le aziende più grandi (come OpenAI) non vendono solo "più pizze", ma vendono accesso a chef diversi.
    • L'abbonamento economico ti dà accesso allo chef "fai-da-te" (modelli veloci).
    • L'abbonamento costoso ti dà accesso allo chef "stellato" (modelli avanzati come o1 o Opus).
  • La logica: Chi è disposto a pagare di più non vuole solo più pizze, vuole pizze migliori. Quindi, il prezzo più alto ti sblocca l'accesso a strumenti più potenti, non solo a più quantità.

4. La Concorrenza: Il "Venditore di Strada" vs. Il "Re"

Immagina che ci sia un grande ristorante di lusso (il proprietario dell'IA) e un venditore ambulante che vende pizze fatte in casa a prezzo di costo (i modelli open-source gratuiti o economici).

  • I clienti poveri: Vanno dal venditore ambulante. Non ne vale la pena pagare il ristorante.
  • I clienti ricchi: Vanno direttamente al ristorante di lusso.
  • I clienti di medio livello: È qui che succede la magia. Il ristorante di lusso deve offrire un'offerta esattamente tale che questi clienti pensino: "Meglio pagare il ristorante e non dovermi preoccupare del venditore ambulante". Il ristorante deve vendere loro esattamente la quantità giusta per non farli scappare dal venditore ambulante, ma non abbastanza da regalare loro troppi profitti.

In Sintesi

Questo studio dice che il caos attuale dei prezzi dell'Intelligenza Artificiale non è casuale. C'è una logica matematica precisa dietro:

  1. Riduci la complessità: Non vendere "token per task", vendi un budget totale.
  2. Sfrutta la concorrenza: Se c'è un'alternativa economica, devi offrire un pacchetto che renda inutile quella alternativa per i clienti di fascia media.
  3. Versiona il prodotto: Chi paga di più deve avere accesso a strumenti più potenti, non solo a più quantità.

In pratica, le aziende stanno già applicando queste regole (anche se non lo sanno!) per massimizzare i profitti. Gli autori hanno solo trovato la "ricetta matematica" che spiega perché le loro strategie funzionano.