Gender Bias in MT for a Genderless Language: New Benchmarks for Basque

Dit onderzoek introduceert twee nieuwe benchmarks om genderbias in machinevertalingen voor het genderneutrale Baskisch te evalueren, waarbij wordt aangetoond dat modellen systematisch de voorkeur geven aan mannelijke vormen en dat er behoefte is aan evaluatiemethoden die zowel linguïstische als culturele context in acht nemen.

Amaia Murillo, Olatz-Perez-de-Viñaspre, Naiara Perez

Gepubliceerd 2026-03-10
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Hoe vertaalmachines de 'neutrale' taal van het Baskisch verdraaien: Een verhaal over vooroordelen

Stel je voor dat je een vertaalmachine hebt die werkt als een zeer slimme, maar soms vooroordeelachtige kok. Deze kok heeft geleerd door miljoenen recepten (teksten) van het internet te eten. Het probleem? De meeste recepten zijn geschreven in talen zoals het Spaans of het Engels, waar woorden voor beroepen vaak een geslacht hebben: een verpleger is mannelijk, een verpleegster is vrouwelijk.

Nu komt er een nieuwe gast: het Baskisch. Het Baskisch is een unieke taal (gesproken in een deel van Spanje en Frankrijk) die geen geslacht kent. In het Baskisch is een verpleger gewoon een verpleger, ongeacht of het een man of een vrouw is. Het woord is neutraal.

De vraag die deze onderzoekers zich stellen, is: Wat doet onze 'kok' als hij een neutraal Baskisch woord moet vertalen naar een taal met geslachten? Kiest hij willekeurig, of volgt hij oude, vooroordelende patronen?

Hier is wat ze hebben ontdekt, vertaald in alledaags taalgebruik:

1. De Twee Nieuwe Speelplaatsen (De Datasets)

Omdat er geen goede tests waren voor het Baskisch, hebben de onderzoekers twee nieuwe 'speelplaatsen' (datasets) gebouwd om de machines te testen.

  • De 'WinoMTeus' Speelplaats (Van Neutraal naar Geslacht):
    Stel je een raadsel voor: "De monteur belde de verpleegster omdat zij haar been had gebroken." In het Baskisch zijn 'monteur' en 'verpleegster' neutrale woorden. Als je dit naar het Spaans vertaalt, moet de machine kiezen: El mecánico (man) of La mecánica (vrouw)?
    De onderzoekers hebben gekeken of de machine kiest voor de mannelijke vorm, zelfs als het beroep in de echte wereld (in het Baskische land) bijna 100% door vrouwen wordt uitgeoefend (zoals een huishoudster).
    Het resultaat: De machines zijn als een ouderwetse man die denkt dat "monteur" altijd een man is en "verpleegster" altijd een vrouw is. Zelfs als de statistieken zeggen dat 96% van de huishoudsters vrouwen zijn, vertaalt de machine het vaak als een mannelijke huisman. Ze kiezen automatisch voor het "standaard" mannelijke woord, alsof dat de norm is.

  • De 'FLORES+Gender' Speelplaats (Van Geslacht naar Neutraal):
    Hier draait het om de andere kant. De machine krijgt een zin in het Spaans of Engels met een duidelijk mannelijk of vrouwelijk woord (bijv. de bestuurder vs. de bestuurster) en moet dit vertalen naar het neutrale Baskisch.
    Het resultaat: De onderzoekers keken of de vertaling beter of slechter was als het oorspronkelijke woord mannelijk was. Het bleek dat sommige machines ietsje beter presteerden als het woord mannelijk was. Alsof de machine denkt: "Ah, dit is een mannelijke zin, die ken ik wel, die vertaal ik makkelijker."

2. De Grote Ontdekking: De "Mannelijke Standaard"

De belangrijkste conclusie van het onderzoek is dat alle geteste systemen (van de grote, bekende vertaalsites tot de nieuwste AI-modellen) een voorkeur hebben voor het mannelijke geslacht.

  • De Analogie van de Standaardkleding: Stel je voor dat de machine een kledingwinkel is. Als je vraagt om een "kledingstuk" (een neutraal beroep), hangt de machine altijd een herenpak op. Zelfs als je zegt: "Dit is voor een vrouwelijke verpleegster", hangt hij soms toch nog steeds een herenpak op, of hij maakt er een onduidelijk pak van.
  • De Realiteit: In de echte wereld zijn veel beroepen (zoals verpleging, kapper, receptie) vaak vrouwelijk. Maar de AI ziet dit niet als de norm. Voor de AI is "man" de standaard, en "vrouw" is een afwijking die extra aandacht nodig heeft.

3. Waarom is dit belangrijk?

Je zou kunnen denken: "Ach, het is maar een vertaalspelletje." Maar dit is gevaarlijk.

  • Onzichtbaarheid: Als een vertaalsysteem altijd zegt dat een monteur een man is, wordt de vrouwelijke monteur onzichtbaar gemaakt in de digitale wereld.
  • Versterking van Stereotypen: Als AI-systemen deze vooroordelen blijven gebruiken, versterken ze het idee dat bepaalde beroepen "voor mannen" of "voor vrouwen" zijn, wat niet klopt met de werkelijkheid.
  • Taal is Macht: Omdat het Baskisch geen geslacht heeft, is het een perfecte testomgeving. Als de machine hier al vooroordelen toont, betekent dit dat de vooroordelen diep in het "brein" van de AI zitten, niet alleen in de grammatica.

Samenvatting in één zin

Deze onderzoekers hebben bewezen dat onze slimme vertaalmachines, net als veel mensen in het verleden, automatisch denken dat "standaard" gelijkstaat aan "mannelijk", en ze hebben nieuwe tools bedacht om dit vooroordeel in het Baskisch te meten en hopelijk in de toekomst te verbeteren.

Het is een oproep aan de ontwikkelaars: Leer de machines dat een "verpleger" net zo goed een vrouw kan zijn, en dat "man" niet de enige standaard is.