UniSkill: A Dataset for Matching University Curricula to Professional Competencies

Dit paper introduceert UniSkill, een nieuw dataset en annotatiegids die universiteitscursussen koppelt aan ESCO-vaardigheden om taalmodellen te trainen voor effectieve curriculum-competentie matching.

Nurlan Musazade, Joszef Mezei, Mike Zhang

Gepubliceerd 2026-03-04
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

De Grote Misverstand: De "Gaten" in de Ladder

Stel je voor dat de wereld van werk een enorme trekpleister is. Aan de ene kant staan de werkgevers (die zoeken naar mensen met specifieke vaardigheden, zoals "koken" of "rekenen"). Aan de andere kant staan de studenten (die willen leren wat ze nodig hebben). En in het midden staat de universiteit (die de lessen geeft).

Het probleem is dat deze drie groepen vaak in verschillende talen spreken.

  • Een werkgever zegt: "Ik zoek iemand die data-analyse kan."
  • Een universiteit zegt: "We hebben een vak genaamd Statistiek voor Beginners."

Deze twee lijken op elkaar, maar ze praten niet altijd dezelfde taal. Vaak weten studenten niet welke vakken ze moeten kiezen om die specifieke baan te krijgen, en weten werkgevers niet welke lessen op de universiteit eigenlijk precies datgene zijn wat ze zoeken. Dit noemen we de "vaardigheidskloof".

Wat hebben deze onderzoekers gedaan? (De "Vertaler")

De onderzoekers (Nurlan, Joszef en Mike) hebben een digitale vertaler gebouwd. Ze hebben een enorme lijst gemaakt, genaamd UniSkill.

Stel je voor dat ze een gigantische matchmaking-app hebben gemaakt, maar dan niet voor liefde, maar voor studie en werk. Ze hebben handmatig gekeken naar duizenden universitaire lessen en ze vergeleken met een officiële Europese lijst van beroepen en vaardigheden (de ESCO-lijst).

Ze hebben twee dingen gedaan:

  1. De Handmatige Match: Mensen hebben gekeken of een specifieke zin in een vakbeschrijving (bijvoorbeeld: "Je leert hoe je databases bouwt") overeenkomt met een vaardigheid op de werkplek (bijvoorbeeld: "Databasebeheer").
  2. De Robot-Maker: Omdat het handmatig doen te lang duurt, hebben ze een slimme AI (een grote taalmodel) gevraagd om nieuwe voorbeelden te bedenken. Het is alsof je een chef-kok vraagt om een recept te schrijven voor een gerecht dat je net hebt beschreven, zodat je meer oefenmateriaal hebt.

Hoe hebben ze het getest? (De "Proefkeuken")

Ze hebben een computerprogramma (een BERT-model, een soort slimme robot die tekst begrijpt) getraind met deze data. Ze wilden weten: Kan deze robot zelfstandig zeggen welke lessen bij welke banen horen?

Ze hebben het op twee manieren getest:

  • Alleen de titel: Kijkt de robot alleen naar de naam van het vak? (Bijv. "Cybersecurity").
  • Titel + Inhoud: Kijkt de robot ook naar de zinnen eronder? (Bijv. "Je leert hoe je hackers tegenhoudt").

Het resultaat?
De robot was verrassend goed! Hij had een 87% slaagkans (F1-score). Dat betekent dat hij heel goed kan voorspellen of een student met een bepaald vak de vaardigheden heeft die een werkgever zoekt.

De Belangrijkste Leerpunten (De "Gouden Tips")

  1. Titels zijn niet genoeg: Als je alleen naar de titel van een vak kijkt, mis je veel details. Het is alsof je een boek koopt alleen op basis van de titel; je weet niet of het een spannend avontuur is of een saai geschiedenisboek. De robot deed het veel beter toen hij ook de inhoud las.
  2. Fake data helpt: Het was een verrassing, maar de "kunstmatige" lessen die de AI zelf had bedacht, hielpen de robot om beter te leren. Het is alsof je een student laat oefenen met fictieve examenvragen voordat hij het echte examen doet.
  3. Het is moeilijk, maar mogelijk: Soms is het lastig om te zeggen of iets wel of niet past. Bijvoorbeeld: Een vak over "Internet-architectuur" heeft misschien te maken met "Cloud-technologie", maar het woord "cloud" staat er niet in. De robot moet hier slim over nadenken.

Waarom is dit belangrijk?

Vroeger moesten studenten raden of hun studie wel nuttig was voor hun toekomstige baan. Met dit systeem kunnen universiteiten en studenten zien: "Oh, dit vak over 'Data-analyse' is perfect voor de baan als 'Systeemanalist'."

Het helpt om de kloof tussen leren en werken te dichten, zodat studenten niet jarenlang iets leren dat ze nooit gebruiken, en werkgevers niet zoeken naar mensen die ze niet kunnen vinden.

Kortom: Ze hebben een slimme vertaler gebouwd die de taal van de universiteit omzet naar de taal van de werkplek, zodat niemand meer in de kou staat.