An interpretable framework using foundation models for fish sex identification

Dit artikel introduceert FishProtoNet, een interpreteerbaar en niet-invasief computervisie-framework dat foundation modellen en prototype-netwerken combineert om het geslacht van de bedreigde delta-koornvis (Hypomesus transpacificus) met succes te identificeren tijdens de voortplantingsfasen.

Zheng Miao, Tien-Chieh Hung

Gepubliceerd 2026-02-24
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

🐟 De "Vis-Boer" die niet hoeft te knippen: Hoe AI het geslacht van vissen raadt

Stel je voor dat je een viskwekerij runt met een heel zeldzame en kwetsbare vissoort: de Delta Smelt. Deze vis is zo belangrijk voor het ecosysteem, maar ook zo kwetsbaar, dat je ze niet mag verwonden.

Het probleem:
Om deze vissen succesvol te kweken, moet je weten welke mannetjes en welke vrouwtjes het zijn. Normaal gesproken doen biologen dit door de vis open te snijden of een cameraatje in te brengen. Dat is als het openen van een cadeau voordat je het mag geven: het verpest de verrassing en doet de vis pijn. Veel vissen sterven hierdoor.

De oplossing:
De onderzoekers hebben een slimme computerprogramma bedacht, genaamd FishProtoNet. Dit is een soort "super-oog" dat naar een foto van de vis kijkt en zegt: "Ah, dit is een mannetje!" of "Ah, dit is een vrouwtje!" – zonder de vis aan te raken.

Hier is hoe het werkt, vertaald in alledaagse termen:

1. De "Schaar" en de "Lijm" (Het uitsnijden van de vis)

Stel je voor dat je een foto hebt van een vis in een troebel aquarium. De achtergrond is rommelig: er zijn stenen, algen en schaduwen. Als je een gewone computer laat kijken, denkt die misschien: "O, deze vis is een mannetje omdat hij op een bruine steen ligt," in plaats van omdat hij echt een mannetje is. De computer leert dan de achtergrond te herkennen, niet de vis.

Om dit op te lossen, gebruiken de onderzoekers twee nieuwe, superkrachtige hulpmiddelen (Foundation Models):

  • Grounding DINO: Dit is als een slimme hond die op commando "Vind de vis!" roept. Hij wijst precies aan waar de vis zit, zelfs als je hem nog nooit eerder hebt gezien.
  • SAM2 (Segment Anything Model): Dit is als een digitale schaar die precies om de vis heen knipt en de rest van de foto (de rommelige achtergrond) weggooit.

Het resultaat: De computer krijgt alleen een schone foto van de vis, zonder afleiding.

2. De "Kleurenverf" (Data Augmentatie)

Omdat ze niet genoeg foto's hebben van deze zeldzame vis, moeten ze de computer slim trainen. Ze nemen de foto's van de vis en doen er een beetje "toverij" mee:

  • Ze draaien de vis een beetje.
  • Ze spiegelen hem.
  • Ze veranderen de helderheid of verbergen een klein stukje van de vis (alsof er een vlek op de foto zit).

Dit is alsof je iemand leert een gezicht herkennen door hem te laten zien in verschillende hoeken, met een pet op, of met een bril. Zo leert de computer echt de kenmerken van de vis te zien, en niet alleen de foto zelf.

3. De "Vergelijkingskaart" (Interpretabel Leren)

Dit is het meest interessante deel. De meeste AI-modellen zijn een "zwarte doos": ze geven een antwoord, maar je weet niet waarom. Dat is gevaarlijk voor biologen; ze willen weten of de AI echt naar de buik van de vis kijkt of naar een vlekje op de achtergrond.

FishProtoNet werkt anders. Het gebruikt een prototype-netwerk.

  • De Analogie: Stel je voor dat je een kind leert dieren te herkennen. Je laat het een foto van een "echte mannetjesvis" zien en een "echte vrouwtjesvis".
  • De computer maakt in zijn hoofd een ideale kaart (een prototype) van hoe een mannetje eruit moet zien en hoe een vrouwtje eruit moet zien.
  • Als er een nieuwe vis voorbijkomt, vergelijkt de computer deze niet met een duizend andere foto's, maar met die ideale kaart.
  • "Hoeveel lijkt deze vis op mijn ideale mannetje-kaart?" vraagt de computer.
  • Omdat de computer laat zien waar hij kijkt (bijvoorbeeld: "Ik zie dat de buik iets voller is, dus dit is een vrouwtje"), kunnen biologen dit controleren. Het is alsof de computer zijn werkblad laat zien in plaats van alleen het antwoord.

Wat leerden ze?

  • Het werkt goed: Voor vissen die al volwassen zijn (tijdens of na het paaien), werkt het heel goed. De computer raadt het geslacht in ongeveer 80% van de gevallen goed. De verschillen tussen man en vrouw zijn dan duidelijk zichtbaar.
  • Het is lastig voor baby's: Voor jonge vissen (subadulten) is het nog lastig. Dat is logisch: jonge kinderen lijken vaak op elkaar, of het nu een jongetje of een meisje is. Pas als ze opgroeien, komen de echte verschillen naar voren.

Conclusie

De onderzoekers hebben een manier bedacht om de geslachten van zeldzame vissen te tellen zonder ze te verwonden. Ze gebruiken slimme AI die eerst de vis "uitsnijdt" uit de rommelige achtergrond, en dan vergelijkt met een ideale voorbeeldkaart. Het is een stap voorwaarts om bedreigde diersoorten te beschermen en te kweken, zonder dat er een visje pijn hoeft te lijden.

Kortom: Een digitale schaar, een paar verdraaide foto's en een slimme vergelijkingstest, zodat we de natuur kunnen helpen zonder haar te beschadigen.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →