Knowledge-informed Bidding with Dual-process Control for Online Advertising

Dit paper introduceert KBD, een nieuwe methode voor biedoptimalisatie in online advertenties die menselijke expertise en een dual-process besturingsmechanisme (combinerend snelle PID-regels en een Decision Transformer) integreert om de beperkingen van bestaande black-box modellen in data-sparse en dynamische scenario's te overwinnen.

Huixiang Luo, Longyu Gao, Yaqi Liu, Qianqian Chen, Pingchun Huang, Tianning Li

Gepubliceerd 2026-03-06
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat online adverteren een enorme, razendsnelle veiling is. Elke seconde worden miljoenen advertenties verkocht aan de hoogste bieder. Voor adverteerders is dit een enge wereld: ze willen hun budget zo slim mogelijk uitgeven om de meeste klanten te vinden, zonder te veel te betalen.

Vroeger deden dit slimme mensen (experts) met ervaring. Maar tegenwoordig proberen computers (AI) dit te doen. Het probleem? De huidige computers zijn als automatische koks die alleen recepten uit een oud kookboek volgen. Als er iets onverwachts gebeurt (zoals een nieuwe trend of een grote verkoopdag), raken ze in paniek, omdat ze niet begrijpen waarom iets werkt, maar alleen hoe het in het verleden werkte.

Deze paper introduceert KBD (Knowledge-informed Bidding with Dual-process Control). Dit is een nieuwe manier om te bieden die combineert: menselijke wijsheid met slimme AI.

Hier is hoe het werkt, vertaald naar alledaagse termen:

1. Het Probleem: De "Blindelings Volgende" Robot

Huidige systemen kijken alleen naar historische data.

  • Het gebrek aan ervaring: Als een nieuw product wordt gelanceerd, heeft de computer geen data. Een mens zou zeggen: "Oké, dit is nieuw, we moeten voorzichtig beginnen." De computer probeert echter gewoon te raden op basis van oude, niet-vergelijkbare data.
  • Korte termijn denken: De computer kijkt vaak alleen naar de volgende seconde. "Ik win deze klik!" denkt hij. Maar hij vergeet dat hij hierdoor morgen zijn budget op heeft en geen geld meer heeft voor belangrijke klanten.

2. De Oplossing: KBD (De Twee-Hoofdige Chef)

KBD lost dit op door te denken als een mens met twee hersensystemen (gebaseerd op de Dual-Process Theory):

  • Systeem 1 (De Snelle Reflex): Een ervaren, snelle regel.
  • Systeem 2 (De Denkende Chef): Een complexe, langzame AI die nadenkt over de lange termijn.

Laten we KBD opdelen in twee delen:

Deel A: De Dagelijkse Basis (De "Gids")

Voordat de computer elke uur een beslissing neemt, moet hij een dagelijkse richtlijn hebben.

  • Hoe werkt het? De auteurs gebruiken een systeem genaamd IEFormer. Dit is als een kookboek dat is geschreven door een meesterkok.
  • De creatieve analogie: Stel je voor dat je een soep maakt. De AI (de robot) probeert de smaak te voorspellen. Maar in plaats van blind te proeven, geeft de AI de robot een monotoon kookboek (een regel dat zegt: "Als je meer zout doet, wordt de soep zouter, nooit minder").
  • Waarom is dit slim? De computer leert niet alleen uit data, maar krijgt ook menselijke regels ingebrand. Hij weet bijvoorbeeld: "Als ik meer geld uitgeef, moet ik ook meer resultaten zien." Dit voorkomt dat de robot gekke dingen doet als er weinig data is.

Deel B: Het Uurlijkse Aanpassen (De "Twee-Hoofdige Bestuurder")

Nu de dagelijkse basis staat, moet de computer elke uur beslissen of hij iets meer of minder moet bieden. Hier komen de twee systemen samen:

  1. Systeem 1: De PID-Controller (De "Varende Boot")

    • Dit is een simpele, snelle regel. Stel je voor dat je een boot bestuurt. Als je te ver naar links drijft (te veel uitgegeven), draai je direct rechtsom. Als je te ver naar rechts drijft (te weinig uitgegeven), draai je linksom.
    • Dit systeem is niet heel slim, maar het is zeer betrouwbaar. Het zorgt ervoor dat je nooit je budget overschrijdt. Het is de "veilige reflex".
  2. Systeem 2: De Decision Transformer (De "Strategische Speler")

    • Dit is de super-slimme AI. Hij denkt na over de volgende 24 uur. Hij zegt: "Als ik nu iets meer uitgeef, kan ik morgen een grote klant winnen." Hij is goed in complexe strategieën.
    • Het probleem: Soms is hij te zelfverzekerd en maakt hij fouten als de situatie verandert (bijvoorbeeld tijdens een grote sale).

De Magische Combinatie (Dual-Process Control):
KBD laat deze twee samenwerken op een slimme manier:

  • Tijdens het trainen: De slimme AI (Systeem 2) leert van de snelle reflex (Systeem 1). Hij krijgt een "straf" als hij te ver afwijkt van de veilige regels.
  • Tijdens het spelen: De computer kijkt naar zijn eigen zelfvertrouwen.
    • Is hij zeker van zijn zaak? Dan luistert hij naar Systeem 2 (de strateeg) voor maximale winst.
    • Is hij onzeker (bijvoorbeeld omdat de markt plotseling verandert)? Dan schakelt hij over naar Systeem 1 (de veilige reflex) om geen fouten te maken.

3. Wat leverde dit op?

De auteurs hebben dit getest in de echte wereld (op Alibaba Health) en op openbare datasets.

  • Resultaat: Het systeem verdiende meer geld (GMV) dan de beste bestaande methoden.
  • Waarom? Omdat het systeem niet alleen "leert" uit data, maar ook begrijpt uit menselijke ervaring. Het is niet bang voor nieuwe situaties, omdat het een veilige "reflex" heeft om op terug te vallen.

Samenvatting in één zin

KBD is als het geven van een slimme, strategische AI een ervaren, menselijke gids en een veiligheidsriem, zodat hij niet alleen snel kan denken, maar ook nooit uit zijn jasje springt als het even tegenzit.

Het is de perfecte balans tussen menselijke wijsheid (de regels) en computersnelheid (de AI), zodat adverteerders hun geld slimmer uitgeven, zelfs als de wereld om hen heen verandert.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →