Criteria-first, semantics-later: reproducible structure discovery in image-based sciences

Dit artikel pleit voor een deductieve omkering in de beeldgebaseerde wetenschappen, waarbij reproduceerbare structuurbeschrijvingen eerst worden afgeleid op basis van expliciete criteria en pas later worden gekoppeld aan domeinspecifieke semantiek, om zo de beperkingen van de huidige 'semantics-first'-benadering bij open-ended ontdekking en lange-termijnonderzoek te overwinnen.

Jan Bumberger

Gepubliceerd 2026-02-18
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een enorme bibliotheek binnenloopt, maar in plaats van boeken, zijn de planken vol met miljoenen foto's van de natuur, de stad of je eigen lichaam. De wetenschappers die deze foto's bestuderen, proberen er een verhaal van te maken.

Deze paper stelt een radicale nieuwe manier voor om die foto's te analyseren. Het is een beetje als het verschil tussen eerst de naam geven aan iets, en eerst de vorm begrijpen.

Hier is de uitleg in simpele taal, met een paar creatieve vergelijkingen:

1. Het oude probleem: "Eerst de naam, dan de vorm" (Semantics-first)

Stel je voor dat je een foto van een bos ziet. De huidige manier van werken is alsof je direct probeert te raden: "Dat is een eik, dat is een beuk, dat is een struik."

  • Het probleem: Wat als de foto uit een ander land komt waar ze andere namen voor bomen hebben? Of wat als de camera anders is ingesteld, waardoor de bomen er anders uitzien? Of wat als er een nieuw soort insect op de foto staat dat niemand kent?
  • De consequentie: Als je direct probeert te "namen" (labels te geven), faal je vaak als de omstandigheden veranderen. Het is alsof je probeert een puzzel op te lossen door alleen te kijken naar de randjes van de stukjes, terwijl je de vorm van het stukje zelf negeert. Als de puzzelstukjes een beetje vervormd zijn (door zonlicht, seizoenen of een andere camera), past je "naam" niet meer, en breekt je hele analyse.

2. De nieuwe oplossing: "Eerst de vorm, dan de naam" (Criteria-first)

De auteur, Jan Bumberger, zegt: "Wacht even! Laten we eerst kijken naar wat er echt op de foto te zien is, voordat we gaan praten over wat het heet."

De Analogie van de Klei:
Stel je voor dat je een potter bent.

  • De oude manier: Je neemt een klomp klei en probeert er direct een "kruik" van te maken omdat je dat wilt verkopen. Als de klei een beetje droog is of een andere kleur heeft, lukt het niet, en gooi je het weg.
  • De nieuwe manier: Je kijkt eerst naar de structuur van de klei. Je gebruikt een reeks regels (criteria): "Is het glad? Is het rond? Is het stevig?" Je maakt een perfect gevormde, neutrale bol van klei.
    • Nu kun je die bol gebruiken voor van alles!
    • Vandaag noem je hem een "kruik" (voor de markt).
    • Morgen noem je hem een "vaas" (voor een ander land).
    • Over een jaar, als de smaak verandert, noem je hem een "kunstobject".
    • Het mooie: De bol zelf (de structuur) blijft hetzelfde. Je hoeft de klei niet opnieuw te vormen; je verandert alleen het label dat erbij hoort.

3. Waarom is dit zo slim?

De paper stelt dat we in de wetenschap (van het tellen van vogels tot het scannen van hersenen) vaak te snel gaan "namen". Dit werkt goed als alles stabiel is, maar faalt als:

  • De camera's veranderen.
  • De seizoenen veranderen (een boom in de winter ziet er anders uit dan in de zomer).
  • We iets nieuws ontdekken waarvoor we nog geen naam hebben.

Met de "Eerst de vorm, dan de naam" methode:

  1. Je maakt eerst een stabiel fundament: Je gebruikt strikte regels om de foto op te delen in logische stukken (bijv. "dit is een samenhangend gebied", "dit is een rand"). Dit gebeurt zonder te weten wat het is.
  2. Je kunt later alles aanpassen: Omdat de basis (de vorm) stabiel is, kun je later zeggen: "Oh, dit stukje is nu een 'eik' geworden" of "Oh, dit stukje is een nieuw type schimmel". Je hoeft de hele analyse niet opnieuw te doen.

4. De "Digitale Tweeling" (Digital Twin)

De paper noemt dit ook belangrijk voor "digitale tweelingen" (digitale kopieën van de echte wereld).
Stel je voor dat je een digitale kopie van een stad bouwt om verkeer te plannen.

  • Als je de stad bouwt op basis van namen ("hier is een school, daar een winkel"), en morgen wordt die school een ziekenhuis, moet je de hele digitale stad herbouwen.
  • Als je de stad bouwt op basis van structuur ("hier is een groot gebouw met veel ramen, daar een open plein"), dan kun je later gewoon zeggen: "Die grote ramen zijn nu een ziekenhuis". De basisstructuur blijft werken, en je digitale tweeling blijft bruikbaar, zelfs als de namen en functies veranderen.

Samenvatting in één zin

In plaats van te proberen elke foto direct te benoemen (wat vaak mislukt als de wereld verandert), moeten we eerst de onveranderlijke vorm van de dingen vinden met strikte regels, en pas daarna beslissen wat we het gaan noemen.

Dit maakt wetenschappelijke onderzoekers slimmer, flexibeler en minder afhankelijk van verouderde lijsten met namen, zodat ze ook in de toekomst nieuwe dingen kunnen ontdekken zonder hun hele systeem te moeten slopen.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →