Each language version is independently generated for its own context, not a direct translation.
Stel je voor dat je een zeer slimme, maar soms wat verwarde assistent hebt (een Large Language Model of LLM). Je wilt dat deze assistent een taak voor je uitvoert, bijvoorbeeld: "Vind de perfecte film voor mij."
Als je dit vraagt in gewoon Nederlands, zoals: "Vind een grappige en romantische film die ik zeker leuk zal vinden," kan de assistent in de war raken. Wat bedoel je precies met "zeker leuk"? Moet de film 50% grappig en 50% romantisch zijn? Of moet hij vooral grappig zijn, maar dan wel een beetje romantisch? De assistent moet gissen naar jouw intentie, en dat leidt vaak tot een gemiddeld resultaat.
Dit artikel introduceert een nieuwe manier van praten met deze slimme assistent, genaamd UtilityMax Prompting. In plaats van te praten als een mens, praat je tegen de assistent als een wiskundige.
Hier is hoe het werkt, vertaald naar alledaagse taal:
1. Het Probleem: De Vage Wens
Stel je voor dat je een kok (de LLM) vraagt: "Maak een gerecht dat lekker is, maar ook gezond en niet te duur."
De kok denkt na: "Wat is 'lekker'? Wat is 'niet te duur' voor deze klant?" Hij maakt een gerecht dat misschien wel gezond is, maar niet zo lekker, of juist heel lekker maar te duur. De instructie was te vaag.
2. De Oplossing: De Wiskundige Receptkaart
Met UtilityMax geef je de kok geen vage zin, maar een formule. Je zegt:
"Je doel is om de 'Totale Waarde' van het gerecht te maximaliseren. De formule is: (Lekkerheidsscore) × (Gezondheidsfactor) × (Prijsfactor)."
Nu moet de kok niet meer gissen. Hij moet voor elk mogelijk gerecht die hij bedenkt, de drie getallen apart berekenen en ze vermenigvuldigen. Hij kiest dan het gerecht met het hoogste eindgetal.
3. Hoe werkt dit voor een AI?
In het artikel wordt dit getoetst aan een filmadvies-systeem.
De oude manier (Natuurlijke taal): "Geef mij een film die grappig is, romantisch is en waar ik een hoge score aan zal geven." De AI probeert dit te raden.
De nieuwe manier (UtilityMax): De AI krijgt een opdracht die er zo uitziet:
*"Voor elke film die je kiest, moet je drie dingen schatten:- Hoe hoog is de kans dat ik deze film een hoge score geef? (Bijv. 0.8)
- Is de film een komedie? (Ja = 1, Nee = 0)
- Is de film een romantische film? (Ja = 1, Nee = 0)
Je doel is om het getal te maximaliseren: (Score) × (Komedie?) × (Romantiek?). Als een film geen komedie is, wordt het getal 0, dus die film valt direct af."*
Door deze wiskundige "rekenregels" te geven, wordt de AI gedwongen om stap voor stap na te denken over elk onderdeel van je wens, in plaats van alles door elkaar te halen.
4. Wat hebben ze ontdekt?
De onderzoekers hebben dit getest met drie van de slimste AI-modellen ter wereld (van bedrijven als OpenAI, Google en Anthropic) op een dataset van miljoenen filmbeoordelingen.
Het resultaat? De wiskundige manier werkt veel beter.
- De AI gaf vaker films die écht pasten bij de criteria.
- Het maakte niet uit welke AI je gebruikte; de methode werkte bij allemaal.
- Zelfs als je de AI heel streng instrueerde in gewoon Nederlands ("Geef alleen komedies en romantiek!"), bleef de wiskundige methode beter presteren.
Waarom is dit belangrijk?
Tot nu toe moesten mensen "prompt engineering" doen: ze probeerden de perfecte zin te vinden om de AI te overtuigen. Dit artikel zegt: "Stop met het zoeken naar de perfecte zin. Gebruik in plaats daarvan een formele opdracht."
Het is alsof je stopt met het proberen om een robot te overtuigen met een mooi verhaal, en je hem in plaats daarvan een exacte blauwdruk geeft. De robot hoeft niet meer te "voelen" wat je bedoelt; hij hoeft alleen maar de blauwdruk te volgen.
Kortom: Als je een AI iets complex wilt laten doen met meerdere eisen (zoals: goedkoop, snel én veilig), geef dan geen vaag verzoek. Geef een wiskundige formule. De AI wordt dan een betere "beslissingsmaker" en minder een "gokker".