Demand Estimation with Text and Image Data

Dit artikel presenteert een vraagmodel dat ongestructureerde tekst- en afbeeldingsdata gebruikt om substitutiemogelijkheden te schatten, wat leidt tot betere voorspellingen dan traditionele methoden, vooral wanneer producteigenschappen ontbreken of moeilijk te kwantificeren zijn.

Giovanni Compiani, Ilya Morozov, Stephan Seiler

Gepubliceerd 2026-02-19
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een supermarktmanager bent en je wilt weten: "Als ik de prijs van deze specifieke koffie verhoog, welke andere koffie zullen de mensen dan kopen?" Of: "Als twee grote koffiebedrijven samengaan, wat gebeurt er dan met de prijzen?"

Om dit te weten te komen, moeten economen de vraag schatten. Ze moeten begrijpen hoe producten met elkaar concurreren (wat ze "substitutie" noemen).

Traditioneel deden ze dit door te kijken naar een lijst met kenmerken: Is het koffie? Is het biologisch? Wat is de prijs? Maar dit werkt niet altijd goed. Soms zijn de belangrijkste redenen waarom mensen iets kopen heel moeilijk in cijfers te vatten. Denk aan het ontwerp van een verpakking, de sfeer van een boek, of hoe een product eruit ziet op een foto. Die dingen zijn "onzichtbaar" voor een standaard spreadsheet.

In dit artikel stellen de auteurs een nieuwe, slimme manier voor om dit probleem op te lossen. Ze gebruiken AI en ongestructureerde data (zoals foto's en tekst) om te voorspellen wat mensen doen.

Hier is de uitleg in simpele taal, met een paar creatieve vergelijkingen:

1. De Probleemstelling: De "Blinde" Econoom

Stel je voor dat je een econoom bent die probeert te raden welke producten mensen als vervanging kiezen.

  • De oude manier: Je kijkt alleen naar de "ID-kaart" van het product. Is het een rode auto? Is het een blauwe auto? Maar wat als de rode auto eruitziet als een sportwagen en de blauwe als een familieauto, terwijl ze allebei "rood" zijn? De oude methode mist de nuance.
  • Het probleem: Mensen kopen producten vaak omdat ze er mooi uitzien of omdat de tekst op het label ze aanspreekt. Die informatie is vaak niet in een database te vinden.

2. De Oplossing: De "Digitale Vertaler"

De auteurs gebruiken Deep Learning (een soort super-slimme AI) als een vertaler.

  • De AI als een kunstcriticus: In plaats van te vragen "Is dit een auto?", laat je de AI naar de foto van het product kijken. De AI ziet niet alleen "auto", maar voelt de sfeer: "Oh, dit heeft een strakke lijn, het ziet er snel en modern uit."
  • De AI als een boekrecensent: Voor tekst (zoals beschrijvingen of reviews) leest de AI niet alleen woorden, maar begrijpt ze de betekenis. Als iemand schrijft "perfect voor een regenachtige dag" en een ander schrijft "gezellig voor bij de haard", begrijpt de AI dat deze twee boeken op dezelfde manier worden gewaardeerd, ook al gebruiken ze andere woorden.

De AI zet deze foto's en teksten om in een cijfercode (een "embedding"). Het is alsof je elk product een unieke vingerafdruk geeft die al zijn subtiele eigenschappen vastlegt.

3. De Methode: Het "Mooiste" Patroon Vinden

De AI genereert duizenden cijfers per product. Dat is te veel om mee te werken.

  • De verdichting (PCA): De auteurs gebruiken een techniek om deze duizenden cijfers te "verdichten" tot een paar belangrijke lijnen. Stel je voor dat je een hele berg informatie over een auto reduceert tot twee vragen: "Hoe sportief ziet het eruit?" en "Hoe luxe voelt het?".
  • De selectie: Ze testen verschillende modellen om te zien welke combinatie van foto's en tekst het beste voorspelt welke producten mensen als vervanging kiezen. Het is alsof je een kok bent die verschillende kruidenmengsels uitprobeert om te zien welke het lekkerste gerecht maakt.

4. De Test: Het Boekexperiment

Om te bewijzen dat het werkt, hebben ze een experiment gedaan met boeken.

  • Mensen moesten een boek kiezen uit een lijst.
  • Vervolgens moesten ze een tweede keuze maken uit de overgebleven boeken (alsof hun eerste keuze plotseling uitverkocht was).
  • De verrassing: De modellen die gebruik maakten van de AI-geanalyseerde foto's en recensies voorspelden de tweede keuze veel beter dan de modellen die alleen keken naar de "officiële" kenmerken (zoals genre of aantal pagina's).
  • De les: Mensen kiezen vaak op basis van hoe een boek eruitziet op de cover of wat er in de recensies staat. De AI zag dit patroon, de oude methoden niet.

5. De Toepassing: Amazon in de Praktijk

Ze hebben dit ook getest op 40 verschillende categorieën op Amazon (van kleding tot elektronica).

  • De verrassing: Soms is de foto het belangrijkst (bijvoorbeeld bij kleding), maar soms is de tekst belangrijker (bijvoorbeeld bij boeken of specifieke gadgets), zelfs als je dat van tevoren niet zou verwachten.
  • De conclusie: Je kunt nooit zeker weten welke data het beste werkt. Daarom is het slim om alles te verzamelen (foto's én tekst) en de AI te laten beslissen wat het belangrijkst is.

Waarom is dit geweldig?

Stel je voor dat je een detective bent die probeert te achterhalen wie de dader is (welk product mensen kopen).

  • De oude methode kijkt alleen naar de paspoorten van de verdachten (de officiële kenmerken).
  • De nieuwe methode kijkt ook naar hun kledingstijl, hun stemgeluid en wat ze zeggen in hun dagboeken (foto's en tekst).

Hierdoor ziet de detective veel meer patronen en kan hij veel nauwkeuriger voorspellen wat er gaat gebeuren als de markt verandert (bijvoorbeeld bij een prijsverhoging of een fusie tussen bedrijven).

Kortom: Deze paper laat zien dat we niet meer hoeven te wachten tot mensen hun voorkeuren in een strakke lijst zetten. We kunnen de "ruis" van de echte wereld (foto's, reviews, beschrijvingen) gebruiken met slimme AI om precies te begrijpen wat consumenten echt willen.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →