A stochastic optimization algorithm for revenue maximization in a service system with balking customers

Dit artikel presenteert een stochastische optimalisatie-algoritme dat de verwachte omzet maximaliseert in een wachtrij met balkende klanten door dynamische prijsaanpassingen op basis van een nieuwe Infinitesimal Perturbation Analysis-methode die uitsluitend gebruikmaakt van waarnemingen van effectieve aankomsten.

Shreehari Anand Bodas, Harsha Honnappa, Michel Mandjes, Liron Ravner

Gepubliceerd 2026-03-05
📖 4 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een populaire, maar kleine koffiezaak runt. Je hebt maar één barista (de "single-server queue"). Klanten komen aan, willen een koffie, en betalen een prijs die jij bepaalt.

Je doel is simpel: zo veel mogelijk geld verdienen per uur.

Maar er is een addertje onder het gras: de drukte.

Het Dilemma: Te duur of te druk?

Als je de koffie te goedkoop maakt, komen er heel veel mensen. De rij wordt lang, de wachttijd wordt enorm. En wat gebeurt er dan? Mensen kijken naar de lange rij, denken: "Nee, ik heb geen tijd om hier 20 minuten te wachten," en lopen weg. In de vakwereld noemen ze dit balking (het weigeren om mee te doen).

Als je de koffie te duur maakt, komen er weinig mensen. Je verdient per kopje veel, maar je hebt te weinig klanten.

De kunst is dus om de perfecte prijs te vinden: hoog genoeg om winst te maken, maar laag genoeg (of de wachttijd kort genoeg) om mensen niet weg te jagen.

Het Probleem: Je ziet niet alles

In de echte wereld weet je niet precies hoe mensen reageren. Je ziet alleen de mensen die daadwerkelijk binnenkomen. Je ziet niet de mensen die aan de deur stonden, de lange rij zagen, en besloten om niet te komen. Je hebt dus een "onvolledig plaatje".

De meeste oude methoden proberen eerst een perfecte wiskundige formule te maken van hoe mensen denken. Maar dat is lastig en vaak onnauwkeurig.

De Oplossing: Een slimme, lerende robot

De auteurs van dit paper hebben een slim algoritme bedacht dat werkt als een lerende robot. In plaats van alles van tevoren te weten, probeert de robot continu een beetje te experimenteren:

  1. Probeer een prijs: De robot zet de prijs even op €3,00.
  2. Kijk wat er gebeurt: Hij telt hoeveel mensen er binnenkomen en hoe lang ze moeten wachten.
  3. Pas aan: Als het te druk was (veel mensen liepen weg), probeert hij de prijs iets lager te maken. Als het te rustig was, maakt hij de prijs iets hoger.
  4. Herhaal: Dit doet hij duizenden keren, steeds een beetje fijner instellend, totdat hij de perfecte prijs heeft gevonden.

De Magische Truc: "Infinitesimal Perturbation Analysis" (IPA)

Het moeilijkste deel is: Hoe weet de robot precies hoeveel hij de prijs moet aanpassen?

Stel je voor dat je een auto bestuurt in mist. Je ziet de weg niet, maar je voelt de trillingen van het stuur. Als je het stuur een heel klein beetje draait, voel je of de auto naar links of rechts trekt. Dat geeft je informatie over de weg, zonder dat je hem kunt zien.

De auteurs hebben een wiskundige methode bedacht (IPA) die precies dat doet. Ze kijken naar de kleinste veranderingen in de rijlengte en de aankomsttijden van de mensen die wél binnenkomen. Door deze kleine trillingen te analyseren, kan de robot de "richting" van de beste prijs raden, zelfs zonder de mensen te zien die weglopen. Het is alsof de robot de "geest" van de weg voelt, zonder hem te zien.

Wat levert dit op?

  • Geen gokken: Het algoritme convergeert (komt steeds dichter bij) de echte beste prijs, net als een schutter die zijn vizier steeds fijner afstelt tot hij raakt.
  • Robuust: Het werkt zelfs als de klanten heel lastig zijn of als de koffiebarista soms snel en soms langzaam werkt.
  • Regret (Spijt): De auteurs berekenen hoeveel geld je "misloopt" terwijl het algoritme nog aan het leren is. Ze bewijzen dat deze spijt klein blijft en dat je snel op het juiste spoor zit.

Samenvattend in één zin:

Dit paper beschrijft een slimme manier om de prijs van een dienst (zoals een koffie of een taxi) automatisch en continu aan te passen op basis van de drukte, zodat je maximale winst maakt, zelfs als je niet precies weet hoeveel klanten er weglopen omdat de rij te lang is. Het is een slimme, lerende barista die nooit moe wordt van experimenteren.