Menu Pricing of Large Language Models

Cet article propose un cadre théorique démontrant que la tarification optimale des grands modèles de langage repose sur des contrats à engagement de dépenses et des menus de budgets de tokens, dont les mécanismes correspondent directement aux pratiques observées chez les principaux fournisseurs du secteur.

Dirk Bergemann, Alessandro Bonatti, Alex Smolin

Publié 2026-03-10
📖 6 min de lecture🧠 Analyse approfondie

Each language version is independently generated for its own context, not a direct translation.

Imaginez que vous possédez un restaurant de génie culinaire (c'est le fournisseur de l'IA, comme OpenAI ou Anthropic). Vous avez des cuisiniers ultra-puissants (les modèles d'IA) qui peuvent préparer n'importe quel plat : des petits déjeuners rapides, des dîners gastronomiques complexes, ou même des banquets pour des milliers de personnes.

Le problème ? Vos clients sont tous différents.

  • Le client A veut juste un café rapide (une tâche simple).
  • Le client B veut un menu complet pour 50 personnes (une tâche complexe).
  • Le client C veut cuisiner 100 plats différents en même temps, mais certains sont très simples et d'autres très difficiles.

Comment fixer le prix ? Si vous vendez tout au kilo, vous perdez de l'argent. Si vous vendez tout à l'assiette, c'est trop compliqué à gérer.

C'est exactement le problème que résout ce papier de recherche. Voici l'explication simple, avec des analogies du quotidien.

1. Le problème : Trop d'informations cachées

Normalement, pour vendre, vous voudriez savoir exactement ce que chaque client veut faire. Mais ici, c'est impossible. Le client ne vous dit pas : "Je vais utiliser l'IA pour écrire 3 emails simples et 1 code complexe." Il achète juste un accès.

C'est comme si vous deviez vendre des tickets de cinéma à des gens qui ne vous disent pas s'ils vont regarder un film de 10 minutes ou un film de 3 heures, ni s'ils vont manger du pop-corn ou non. C'est un cauchemar pour le prix !

2. La découverte magique : Le "Score Global"

Les auteurs du papier (des économistes brillants) ont découvert une astuce incroyable. Grâce à la façon dont les IA fonctionnent (une règle mathématique appelée "homogénéité"), ils ont prouvé qu'on n'a pas besoin de connaître tous les détails du client.

L'analogie du "Score de Faim" :
Peu importe si le client veut manger 100 petits sandwichs ou 5 gros hamburgers, ce qui compte vraiment, c'est sa faim totale.

  • Le client qui veut 100 sandwichs a une "faim globale" de 100.
  • Le client qui veut 5 hamburgers a aussi une "faim globale" de 100.

Pour le restaurant, ces deux clients sont identiques. Ils vont consommer la même quantité totale d'ingrédients (de "tokens", comme on dit dans le jargon de l'IA).
Résultat : Au lieu de devoir deviner des milliers de détails sur chaque client, le vendeur peut se contenter d'un seul chiffre : le Score Global du client. Cela transforme un problème impossible en un problème simple.

3. La solution : Le "Menu de Crédits" (Comme un forfait téléphonique)

Une fois qu'on sait que tout le monde se résume à un "Score Global", comment vendre ? Le papier montre que la meilleure stratégie n'est pas de vendre des plats à l'unité, mais de vendre des forfaits de dépenses.

Imaginez trois façons de vendre, qui correspondent à ce qu'on voit aujourd'hui :

  • Le "Forfait Max" (Maximum Spend) :

    • L'analogie : Vous payez 20 € pour un carnet de 100 tickets. Vous pouvez manger ce que vous voulez, mais une fois les 100 tickets épuisés, c'est fini. Plus de repas !
    • Dans la vraie vie : C'est ce que fait Quora Poe. Vous payez un abonnement, vous avez des "points". Si vous les utilisez sur un gros modèle (le plat cher), ça va vite. Si vous les utilisez sur un petit modèle, ça dure longtemps. Mais si vous tombez à 0, c'est fini.
  • Le "Forfait Min" (Minimum Spend) :

    • L'analogie : Vous vous engagez à dépenser au moins 50 € par mois. Si vous dépensez plus, pas de problème, vous payez le prix fort pour chaque assiette supplémentaire.
    • Dans la vraie vie : C'est ce que fait GitHub Copilot. Vous payez un abonnement, vous avez un certain nombre de "requêtes". Si vous dépassez, vous pouvez continuer à payer à l'unité.
  • Le "Menu par Niveaux" (Versioning) :

    • L'analogie : Le restaurant a trois salles.
      • Salle Standard : Cuisine rapide, plats simples.
      • Salle VIP : Cuisine de luxe, plats complexes.
      • Salle Royale : Le Chef étoilé personnel.
    • Dans la vraie vie : C'est ce que fait OpenAI. Le forfait à 20 vousdonneacceˋsauxmodeˋlesstandards.Leforfaitaˋ200 vous donne accès aux modèles standards. Le forfait à 200 vous donne accès au "Chef étoilé" (le modèle le plus intelligent, o1) que les autres ne peuvent pas toucher.

4. La concurrence : Le "Marché Noir" (Open Source)

Le papier imagine aussi une situation où il y a un Grand Restaurant (OpenAI) et des Food Trucks gratuits ou très bon marché (les modèles Open Source).

  • Les petits clients (ceux qui ont peu de faim) vont directement chez les Food Trucks. Pourquoi payer le Grand Restaurant pour un sandwich ?
  • Les clients moyens sont coincés. Le Grand Restaurant doit leur offrir juste assez de nourriture pour qu'ils n'aient pas envie d'aller aux Food Trucks en plus. C'est une stratégie de "dissuasion".
  • Les gros clients (ceux qui ont une faim énorme) sont les seuls à pouvoir se permettre le Grand Restaurant. Le restaurant peut alors leur vendre des plats très chers, car ils n'ont pas le temps d'aller aux Food Trucks.

En résumé

Ce papier explique pourquoi les prix de l'IA sont ce qu'ils sont aujourd'hui :

  1. Ce n'est pas du hasard : Les prix ne sont pas fixés au hasard. Ils sont le résultat d'une optimisation mathématique pour gagner le maximum d'argent tout en vendant à tout le monde.
  2. La simplicité est reine : Même si l'IA est complexe, les fournisseurs la vendent comme un simple "budget de consommation" (des crédits, des tokens).
  3. Tout le monde ne paie pas la même chose : Les petits utilisateurs paient peu (ou utilisent des alternatives gratuites), tandis que les gros utilisateurs paient cher pour avoir accès aux meilleurs outils et aux plus gros volumes.

C'est un peu comme si le monde de l'IA avait enfin trouvé la recette parfaite pour transformer un plat complexe en un menu simple, rentable et adapté à chaque appétit.