Each language version is independently generated for its own context, not a direct translation.
De "Ramsa": Een Geluidskast vol met de Stem van de Emiraten
Stel je voor dat je een enorme, glazen kast bouwt. In deze kast leg je niet oude borden of boeken, maar geluid. Duizenden uren aan geluid. Maar niet zomaar geluid: dit is de stem van de Verenigde Arabische Emiraten (VAE). Dit project heet Ramsa.
De auteur, Rania Al-Sabbagh, heeft deze kast gebouwd omdat er tot nu toe te weinig geluid was om de echte, levendige taal van de Emiraten goed te begrijpen en voor computers te laten leren. Hier is hoe het werkt, vertaald naar alledaags taalgebruik:
1. Het Probleem: De "Blinde Vlek"
Vroeger was het alsof je een enorme bibliotheek had, maar de hele afdeling over de Emiraten was leeg of vol met slechts één soort boek.
- Te weinig boeken: Er waren bestaande verzamelingen, maar die waren vaak te klein (soms maar een paar uur).
- Slechte diversiteit: In die oude verzamelingen waren er vaak veel mannen en weinig vrouwen. En ze behandelden de taal alsof iedereen in het land exact hetzelfde spreekt.
- De realiteit: Maar in de VAE is dat niet zo! Er zijn verschillende "stijlen" van spreken:
- Stedelijk: De mensen in de grote steden.
- Bedoeïen: De mensen uit de woestijn.
- Berg/Shihhi: De mensen uit de bergen (zoals in Ras Al Khaimah).
- Gemengd: Veel jongeren spreken een mix van alles.
Ramsa is gemaakt om deze leegte op te vullen. Het is een 41 uur durende geluidskast met 157 verschillende sprekers (59 vrouwen en 98 mannen), zodat het een eerlijk beeld geeft van wie er in het land woont.
2. Wat zit er in de kast?
De kast bevat twee soorten geluid, net als een mix van een podcast en een tv-programma:
- Gesprekken (Interviews): Mensen die rustig in een kantoor zitten en vragen beantwoorden over hun leven, eten, en cultuur. Dit is als een diepgaand gesprek met een vriend.
- Televisie-uitzendingen: Fragmenten van echte tv-shows over geschiedenis, koken, landbouw en architectuur. Dit is levendiger, soms met muziek op de achtergrond, en soms met veel mensen die tegelijk praten.
De makers zijn heel zorgvuldig geweest. Ze hebben niet de "schoolse" taal (zoals in een boek) gebruikt, maar de echte, dagelijkse taal. Als iemand een woord korter zegt of een klank verandert, hebben ze dat precies zo opgeschreven. Het is alsof je een fototoestel gebruikt in plaats van een schilderij; je wilt de realiteit zien, niet een geïdealiseerde versie.
3. De "Robot-Test": Kunnen computers dit verstaan?
De auteur heeft een deel van deze kast (ongeveer 10%) gebruikt om te testen of moderne computers (kunstmatige intelligentie) de Emirati-taal kunnen verstaan en kunnen nabootsen.
Luisteren (ASR): Ze hebben geprobeerd om de computer te laten luisteren en de tekst op te schrijven.
- Het resultaat: De beste computer (Whisper-large-v3-turbo) kon ongeveer 73% van de woorden correct opschrijven. Dat klinkt misschien niet als 100%, maar voor een taal die zo weinig data heeft, is dat een enorme prestatie!
- Moeilijkheden: Het was het makkelijkst als iemand rustig sprak (zoals in een documentaire). Het was het moeilijkst als mensen elkaar onderbraken of snel tegen elkaar schreeuwden (zoals in een kookshow). Dat is voor een computer net zo lastig als voor een mens in een drukke kroeg.
Spreken (TTS): Ze hebben geprobeerd om de computer te laten praten in de Emirati-stijl.
- Het resultaat: Een systeem genaamd MMS-TTS-Ara deed het het beste. Het klonk redelijk natuurlijk, maar er is nog veel ruimte voor verbetering. Het is alsof je een robot hebt die net begint met het leren van een dialect; hij kent de woorden, maar de "smaak" en het accent moeten nog wat meer oefening.
4. Waarom is dit belangrijk?
Stel je voor dat je een nieuwe auto bouwt, maar je hebt alleen maar foto's van auto's in de sneeuw. Je weet niet hoe ze werken in de hitte of in de modder.
- Voor de technologie: Zonder deze "Ramsa-kast" kunnen spraakassistenten (zoals Siri of Alexa) de Emirati-taal niet goed begrijpen. Ze zouden denken dat iedereen in Dubai exact hetzelfde spreekt als in Cairo of Dubai.
- Voor de cultuur: Het helpt om de verschillende dialecten te bewaren. Net zoals je oude foto's bewaart, bewaart Ramsa de klank van de taal voor de toekomst.
- Voor de mensen: Het zorgt ervoor dat vrouwen en mensen uit de bergen en woestijn ook gehoord worden, niet alleen de mannen uit de stad.
5. De "Nog niet klaar"-status
Het is belangrijk om te weten dat Ramsa nog in aanbouw is.
- De auteurs hebben nu pas 10% van de geluiden getranscribeerd (omgezet naar tekst).
- Ze merken dat het soms lastig is om annotatoren (mensen die de tekst controleren) te vinden die alle dialecten perfect kennen, vooral de oudere generaties.
- De tv-fragmenten mogen niet zomaar worden gedeeld vanwege auteursrechten, maar de data voor onderzoekers is wel beschikbaar onder strikte regels.
Kortom:
Ramsa is als het leggen van de eerste, stevige fundamenten voor een huis. Tot nu toe waren de muren van de Emirati-taal voor computers dun en onvolledig. Met deze nieuwe, rijke verzameling geluiden kunnen we nu een stevig huis bouwen waar de technologie eindelijk de echte, diverse en prachtige stem van de Emiraten kan horen en begrijpen.