SPGen: Stochastic scanpath generation for paintings using unsupervised domain adaptation

SPGen is een nieuw diep-leringsmodel dat met behulp van ongecontroleerde domeinadaptatie en stochastische generatie de blikbewegingen van kijkers op schilderijen voorspelt om bij te dragen aan de behoud en waardering van cultureel erfgoed.

Mohamed Amine Kerkouri, Marouane Tliba, Aladine Chetouani, Alessandro Bruno

Gepubliceerd 2026-02-26
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je naar een prachtig schilderij in een museum kijkt. Je ogen bewegen niet willekeurig; ze springen van het ene interessante detail naar het andere. Deze route die je ogen afleggen, noemen onderzoekers een "scanpath".

Het artikel dat we bespreken, introduceert een slimme nieuwe computerprogramma genaamd SPGen. Dit programma is een soort "oog-voorspeller". Het probeert te raden hoe een mens naar een schilderij zou kijken, zelfs zonder dat er echt iemand naar kijkt.

Hier is hoe het werkt, uitgelegd met simpele vergelijkingen:

1. Het probleem: Foto's vs. Schilderijen

Stel je voor dat je een computer hebt getraind om te begrijpen hoe mensen kijken naar natuurlijke foto's (zoals een hond in een park of een drukke straat). Die computer is daar heel goed in geworden.

Maar als je diezelfde computer nu een schilderij laat zien (bijvoorbeeld een oud meesterwerk van Rembrandt), raakt hij in de war. Waarom? Omdat een schilderij er heel anders uitziet dan een foto. De kleuren, de stijl en de compositie zijn anders. Het is alsof je iemand die perfect Nederlands spreekt, plotseling laat proberen om in het Chinees te praten zonder les te hebben gehad. De computer "weet" niet hoe hij naar kunst moet kijken.

2. De oplossing: Een slimme vertaler (Domain Adaptation)

Om dit op te lossen, hebben de onderzoekers een slimme truc bedacht, genaamd Unsupervised Domain Adaptation.

  • De Analogie: Stel je voor dat de computer een student is die al jarenlang geoefend heeft met het lezen van kranten (natuurlijke foto's). Nu moet hij echter gedichten van dichters uit de 17e eeuw (schilderijen) lezen.
  • De Truc: In plaats van de student opnieuw te laten beginnen, geven ze hem een "geheime vertaler" (de Gradient Reversal Layer). Deze vertaler zorgt ervoor dat de student leert wat er gemeenschappelijk is tussen kranten en gedichten (bijvoorbeeld: waar zijn de belangrijke woorden? Waar ligt de focus?), en negeert wat specifiek is voor de ene of de andere vorm (zoals de lettertype van de krant versus de inkt van de schilder).
  • Het Resultaat: De computer leert zo dat hij zijn kennis van foto's kan gebruiken om ook naar schilderijen te kijken, zonder dat hij duizenden voorbeelden van menselijke blikken op schilderijen nodig heeft.

3. Het toevals-element: Waarom iedereen anders kijkt

Als jij en ik naar hetzelfde schilderij kijken, kijken we niet precies op dezelfde manier. Jij kijkt misschien eerst naar het gezicht, ik eerst naar de achtergrond. Dit heet stochasticiteit (toeval).

  • Het Probleem: Computers zijn meestal heel strikt en voorspelbaar. Als je ze hetzelfde beeld geeft, geven ze altijd hetzelfde antwoord. Dat is niet natuurlijk voor menselijke ogen.
  • De Oplossing: De onderzoekers hebben een "ruis-generator" toegevoegd. Denk hierbij aan een dobbelsteen of een willekeurige windvlaag.
  • De Temperatuur: Ze hebben een knop genaamd "Temperatuur".
    • Lage temperatuur: De computer is heel rustig en kiest de meest logische plek om te kijken (vaak het midden).
    • Hoge temperatuur: De computer is wat "dronkener" of speelser. Hij kijkt naar meer verschillende plekken, wat meer lijkt op hoe echte mensen soms dwalen met hun blik. Hierdoor kan het programma voor één schilderij meerdere verschillende, maar toch logische, kijkroutes voorspellen.

4. Wat levert dit op?

Dit programma is niet alleen leuk voor de wetenschap, maar heeft een groot doel: het behoud van cultureel erfgoed.

  • Musea: Musea kunnen dit gebruiken om te begrijpen welke onderdelen van een schilderij mensen het meest aantrekken.
  • Restauratie: Het kan helpen bij het restaureren van oude kunst, door te weten waar de aandacht van de kijker naartoe gaat.
  • Virtual Reality: Het kan helpen bij het maken van betere virtuele museumbezoeken, waarbij de camera of de beleving automatisch meebeweegt met hoe een mens zou kijken.

Samenvattend

SPGen is een slimme computer die leert hoe mensen naar kunst kijken. Hij is getraind op gewone foto's, maar heeft een slimme "vertaler" gekregen om ook naar schilderijen te kijken. Bovendien heeft hij een knop voor "toeval", zodat hij niet altijd op dezelfde manier kijkt, maar net als een mens soms eens een andere kant op slaat. Hierdoor kunnen we kunst beter begrijpen en bewaren voor de toekomst.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →