Each language version is independently generated for its own context, not a direct translation.
Stel je voor dat je een enorme bibliotheek binnenstapt, vol met 32 zeer technische boeken over de energieverbruik van kunstmatige intelligentie. Je krijgt een vraag: "Hoeveel water verbruikt een AI-model tijdens het trainen?" en je moet het antwoord geven met een precisie van 0,1%, terwijl je ook exact moet aangeven op welke bladzijde je het hebt gevonden. Als je het antwoord niet weet, mag je eerlijk zeggen: "Ik weet het niet."
Dit is precies de uitdaging waar KohakuRAG voor is ontworpen. Het is een slimme "zoekmachine en vertaler" die helpt om vragen te beantwoorden op basis van grote documenten, zonder dat de computer verzint (hallucineert) of de bron verliest.
Hier is hoe KohakuRAG werkt, vertaald naar alledaagse taal:
1. De Bibliotheek niet in stukjes hakken, maar in lagen ordenen
Het oude probleem:
Stel je voor dat je een boek in de schuur gooit en het in duizenden willekeurige stukjes papier snijdt. Als je nu een vraag stelt, zoekt de computer in die losse flarden. Het probleem? De context is weg. Je weet niet meer welke paragraaf bij welk hoofdstuk hoorde. En als je een antwoord vindt, weet je niet meer of het uit hoofdstuk 1 of 10 komt.
De KohakuRAG-oplossing:
KohakuRAG behandelt documenten als een groot, goed georganiseerd huis.
- Het dak is het hele document.
- De kamers zijn de hoofdstukken.
- De muren zijn de alinea's.
- De tegels zijn de zinnen.
In plaats van alles in één grote hoop te gooien, bouwt het systeem een hiërarchische kaart. Als het een zin vindt, weet het direct: "Ah, deze zin zit in de badkamer van de eerste verdieping." Dit maakt het veel makkelijker om later te zeggen: "Het antwoord staat op pagina 12, in de paragraaf over waterverbruik."
2. De slimme vertaler die meerdere vragen stelt
Het oude probleem:
Soms zoekt de computer op het woord "stroomverbruik", maar staat het antwoord in het boek onder "energie-efficiëntie". Een simpele zoekopdracht mist dan het antwoord, omdat de woorden niet exact overeenkomen.
De KohakuRAG-oplossing:
KohakuRAG gebruikt een slimme vertaler (een AI) die als een detective werkt. Als jij vraagt: "Hoeveel stroom verbruikt Google?", denkt de vertaler niet alleen aan "stroom", maar bedenkt hij ook:
- "Misschien staat het onder 'energie-efficiëntie'?"
- "Of misschien onder 'PUE' (een technische afkorting)?"
- "Of misschien in een rapport over 'duurzaamheid'?"
De vertaler stelt dus vier verschillende vragen tegelijk aan de bibliotheek. Vervolgens kijkt hij welke antwoorden door meerdere vragen werden gevonden. Als drie van de vier zoektochten naar dezelfde pagina wijzen, weet hij: "Dit is waarschijnlijk het juiste antwoord!"
3. Het panel van experts (Ensemble)
Het oude probleem:
Als je één persoon vraagt om een moeilijk vraag te beantwoorden, kan die persoon een slechte dag hebben, een fout maken of twijfelen. In de wereld van AI noemen we dit "stochastisch" (willekeurig). Soms geeft de computer een goed antwoord, soms een raar antwoord, en soms zegt hij "Ik weet het niet", terwijl het antwoord er wel was.
De KohakuRAG-oplossing:
KohakuRAG roept negen verschillende experts (of dezelfde computer, maar negen keer) om het antwoord te geven.
- Als 8 experts zeggen: "Het is 500 liter," en 1 expert zegt: "Ik weet het niet," dan luistert het systeem naar de 8 experts.
- De truc: Als een expert zegt "Ik weet het niet" (terwijl de anderen het wel weten), negeert KohakuRAG die twijfel. Het laat de "zorgzame maar onzekere" expert niet de hele groep domineren.
- Als niemand het weet, zegt het systeem pas echt: "Wij weten het niet." Dit voorkomt dat de computer verzint (hallucineert).
4. De "Nog eens proberen"-knop
Soms zegt de computer: "Ik vind het antwoord niet." In plaats daarvan om de hand te geven, heeft KohakuRAG een retried-mechanisme.
Stel je voor dat je een sleutel in een donkere kamer zoekt. Als je hem niet direct vindt, geef je niet op. Je doet je ogen open, je zoekt met een zaklamp (meer context toevoegen) en je zoekt opnieuw. KohakuRAG doet precies dit: als het eerste antwoord "Ik weet het niet" is, zoekt het nog eens, maar dan met meer informatie. Vaak vindt het het antwoord dan wel.
Waarom won KohakuRAG de wedstrijd?
In de "WattBot 2025 Challenge" moesten systemen vragen beantwoorden over AI-energieverbruik. KohakuRAG won omdat:
- Het de structuur van de boeken respecteerde (geen losse flarden).
- Het slimme vertalingen gebruikte om de juiste pagina's te vinden.
- Het luisterde naar een groep experts in plaats van één persoon.
- Het niet snel opgaf, maar opnieuw zocht als het antwoord niet direct duidelijk was.
Kortom: KohakuRAG is als een super-georganiseerde bibliothecaris die niet alleen snel zoekt, maar ook weet hoe hij boeken moet lezen, meerdere meningen combineert en nooit iets verzint als hij het niet zeker weet. Hierdoor werd het de nummer 1 in de wereld van AI-vraagbaak-systemen.