Position: Evaluation of Visual Processing Should Be Human-Centered, Not Metric-Centered

Dit standpuntspaper pleit ervoor dat de evaluatie van moderne visuele verwerkingssystemen minder gericht moet zijn op enkele objectieve beeldkwaliteitsmetrieken en meer op menselijke perceptie en context om innovatie te stimuleren en onderzoek te sturen.

Jinfan Hu, Fanghua Yu, Zhiyuan You, Xiang Yin, Hongyu An, Xinqi Lin, Chao Dong, Jinjin Gu

Gepubliceerd 2026-03-10
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een kok bent die de lekkerste soep ter wereld maakt. Maar in plaats van dat mensen de soep proeven en zeggen of ze hem lekker vinden, wordt je beloond op basis van een thermometer die alleen meet hoe heet de soep is.

Als je de soep 100 graden maakt, win je de prijs. Maar als je de soep 90 graden maakt en hij is dan veel lekkerder, verlies je. En zo is het ook gegaan met de wereld van beeldherstel (het verbeteren van oude, wazige foto's) in de kunstmatige intelligentie.

Dit artikel is een roep om de boel te hervormen. Hier is wat er gebeurt, verteld in gewone taal:

1. De oude manier: De "Rustieke Thermometer"

Jarenlang keken wetenschappers naar cijfers om te zien of hun nieuwe software goed was. Ze gebruikten meetlatjes zoals PSNR en SSIM.

  • De analogie: Dit is alsof je een schilderij beoordeelt op basis van hoeveel verf er precies op de doek zit, in plaats van of het schilderij mooi is.
  • Het probleem: Deze meetlatjes houden van "perfecte" lijntjes en kleuren die exact overeenkomen met het origineel. Maar als je een oude foto wilt repareren, wil je vaak nieuwe details toevoegen die er niet waren (zoals de textuur van een huid of haren op een dier). De oude meetlatjes vinden dat "fout" en geven een slechte score, terwijl het voor een mens juist veel mooier en realistischer oogt.

2. De nieuwe manier: De "Creatieve Kunstenaar"

Vandaag de dag gebruiken we slimme AI's (zoals GANs en Diffusiemodellen) die kunnen "dromen" en nieuwe details kunnen bedenken.

  • De analogie: Stel je voor dat een AI een oude, wazige foto van een hond ziet. De oude software probeert de wazigheid weg te halen door de hond scherp te maken, maar hij ziet eruit als een plastic pop. De nieuwe AI "droomt" de haren van de hond erbij. Hij ziet eruit als een echte hond.
  • De botsing: De oude meetlatjes zeggen: "Die AI heeft de hond niet perfect nagemaakt, hij heeft er haren bijgedroomd die er niet in de originele foto stonden. Slechte score!" De mens zegt: "Wow, die hond ziet er eindelijk echt uit! Geweldig!"

3. Het gevaar: Het spelletje "Cijfers optimaliseren"

Omdat wetenschappers beloond worden voor hoge cijfers, beginnen ze hun software te "cheaten".

  • De analogie: Het is alsof de kok de thermometer op 100 graden zet door er een hete steen in de soep te gooien. De thermometer zegt "Perfect!", maar als je de soep proeft, is hij verbrand en onsmakelijk.
  • In de wereld van AI betekent dit dat modellen soms foto's maken die eruitzien alsof ze met een scherp mes zijn bewerkt (te scherpe randen, rare patronen) puur om de cijfers te verhogen. Voor het menselijk oog zien deze foto's er vaak onnatuurlijk en zelfs lelijk uit.

4. De oplossing: Laat de mensen proeven!

De auteurs van dit artikel zeggen: "Stop met blindelings naar de thermometer te kijken."

  • De nieuwe regel: We moeten de menselijke mening weer centraal stellen.
  • Hoe? Niet door één cijfer te geven, maar door te kijken naar context.
    • Is het een foto van een gezicht? Dan moet de neus er goed uitzien.
    • Is het een tekenfilm? Dan moet de stijl behouden blijven.
    • Is het een landschap? Dan moeten de bomen er natuurlijk uitzien.
  • Een enkele score (zoals "85 punten") zegt niets over of de foto echt mooi is. We hebben een multidimensionale beoordeling nodig, waarbij echte mensen kijken en zeggen: "Dit voelt goed aan."

Samenvattend

De boodschap is simpel: Kwaliteit is iets dat mensen voelen, niet iets dat computers berekenen.

We moeten stoppen met de AI's te dwingen om te spelen met cijfers die ze niet begrijpen, en ze in plaats daarvan laten werken voor de mensen die de foto's uiteindelijk gaan bekijken. Laat de "thermometer" een hulpmiddel zijn, maar niet de baas. De echte winnaar is degene die de mooiste, meest natuurlijke foto maakt, niet degene met het hoogste cijfer op een spreadsheet.