Interpreting Contrastive Embeddings in Specific Domains with Fuzzy Rules

Dit paper presenteert een methode die fuzzy regels combineert met CLIP-embeddings om vrije tekst uit specifieke domeinen, zoals medische verslagen en filmrecensies, te interpreteren en te structureren.

Javier Fumanal-Idocin, Mohammadreza Jamalifard, Javier Andreu-Perez

Gepubliceerd 2026-03-13
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

🧠 De "Vertaler" en de "Slimme Regels"

Stel je voor dat je een enorme bibliotheek hebt vol met boeken (teksten) en foto's. Een heel slimme computer, genaamd CLIP, heeft deze bibliotheek gelezen en elke pagina in een soort "geheime code" omgezet. Deze code is een reeks getallen (een vector) die vertelt waar het boek over gaat.

Het probleem? Deze code is heel goed, maar ook heel mysterieus. Het is alsof de computer zegt: "Dit boek hoort bij groep 42", maar je weet niet waarom. Waarom hoort een verhaal over een film over een robot bij groep 42 en een verhaal over een robot in een ziekenhuis bij groep 43?

De auteurs van dit paper willen die mysterieuze groepen (de "embeddings") begrijpen. Ze willen weten: Welke woorden of gevoelens zorgen ervoor dat een tekst in die specifieke groep terechtkomt?

🎯 Het Doel: Van "Zwart Doos" naar "Glazen Doos"

Om dit op te lossen, gebruiken ze twee hulpmiddelen:

  1. Gevoelsanalyse (Sentiment Analysis): Dit is als een emotionele thermometer. Het meet of een tekst positief, negatief, neutraal is, en hoe subjectief (persoonlijk) of objectief hij is.
  2. Fuzzy Regels (Fuzzy Rules): Dit is het echte geheim. In plaats van harde regels als "Als het woord 'goed' staat, dan is het positief", gebruiken ze zachte, menselijke regels. Denk aan: "Als de stemming een beetje positief is en de tekst heel persoonlijk, dan hoort het bij groep A."

Het idee is om deze "gevoelsregels" te koppelen aan de "geheime code" van de computer. Zo kunnen we zeggen: "Ah, teksten met veel 'hoog' subjectiviteit en 'gemiddelde' positiviteit belanden altijd in die ene cluster."

🏥 Twee Werelden: Ziekenhuis vs. Bioscoop

De auteurs hebben dit getest in twee heel verschillende werelden, alsof ze twee verschillende soorten bibliotheken bezoeken:

  1. De Ziekenhuisbibliotheek (Klinische Data):

    • Wat: Verslagen van patiënten die een beroerte hebben gehad en praten over hun revalidatie-oefeningen.
    • De Analogie: Dit is als een gesprek in een rustige wachtkamer. De mensen praten over dezelfde dingen (pijn, oefeningen, apparatuur) en gebruiken vergelijkbare woorden.
    • Het Resultaat: Hier werkte het systeem uitstekend. Omdat de verhalen soepel liepen, konden de "Fuzzy Regels" heel duidelijk zien welke gevoelens bij welke groep hoorden. Het was alsof je een patroon herkent in een simpel bordspel.
  2. De Bioscoopbibliotheek (IMDB Filmrecensies):

    • Wat: 50.000 recensies van films.
    • De Analogie: Dit is als een drukke kermis. Iedereen praat over iets anders (acteurs, plot, camera, muziek) en gebruikt heel verschillende woorden.
    • Het Resultaat: Hier was het moeilijker. De "geheime code" van de computer was hier zo complex en chaotisch dat de simpele "gevoelsregels" niet alles konden verklaren. Het was alsof je probeert een ingewikkeld danspasje te voorspellen door alleen naar de schoenen van de danser te kijken.

🛠️ Hoe hebben ze het gedaan? (De Stappen)

Stel je voor dat je een detective bent:

  1. De Code maken: Ze nemen alle teksten en sturen ze door de CLIP-computer om de "geheime codes" te krijgen.
  2. Groeperen: Ze kijken naar die codes en zeggen: "Oké, deze 100 teksten lijken op elkaar, laten we ze in een hoopje (cluster) stoppen."
  3. De Emotie-meting: Ze meten voor elke tekst hoe positief, negatief of subjectief hij is.
  4. De Regels bedenken: Ze gebruiken een slim algoritme (een genetisch algoritme, dat werkt als natuurlijke selectie) om de beste "Fuzzy Regels" te vinden.
    • Voorbeeld regel: "Als de tekst hoog subjectief is en laag negatief, dan hoort hij bij Cluster 1."
  5. Testen: Ze kijken of deze regels de juiste groepen voorspellen.

💡 Wat hebben ze geleerd? (De Conclusies)

  • Menselijke taal werkt beter bij specifieke onderwerpen: Als mensen over hetzelfde onderwerp praten (zoals revalidatie), kun je hun gevoelens heel goed koppelen aan hoe een computer de tekst ziet.
  • Te veel variatie is lastig: Als mensen over van alles en nog wat praten (zoals films), wordt het patroon te rommelig voor simpele regels.
  • De "Fuzzy" aanpak is slim: Het gebruik van "Fuzzy Sets" (waar dingen niet alleen "ja" of "nee" zijn, maar "een beetje ja") gaf betere resultaten dan harde regels, vooral in de medische data.
  • De afweging: Er is een spanningsveld tussen nauwkeurigheid en begrijpelijkheid. Als je te veel regels toevoegt om alles perfect te voorspellen, wordt het systeem weer onbegrijpelijk. Als je het te simpel houdt, wordt het minder nauwkeurig.

🚀 Wat komt er nu?

De auteurs willen dit in de toekomst gebruiken om nog beter te begrijpen hoe patiënten zich voelen tijdens hun herstel, zodat artsen en computers samen beter kunnen helpen. Ze hopen ook om deze "regels" te combineren met andere slimme methoden om de "zwarte doos" van kunstmatige intelligentie nog transparanter te maken.

Kortom: Ze hebben een manier gevonden om de "geheime taal" van slimme computers te vertalen naar regels die mensen (en artsen) kunnen begrijpen, vooral als de gesprekken over een specifiek onderwerp gaan.