Position: Vector Prompt Interfaces Should Be Exposed to Enable Customization of Large Language Models

Dit standpuntspaper pleit ervoor dat modelproviders vectorprompt-ingangen blootleggen als publieke interface voor het aanpassen van grote taalmodellen, omdat deze methode schaalbaarder en stabieler is dan tekstgebaseerde prompting en beter voldoet aan de eisen van inferentie-only-aanpassing zonder de beveiligingsrisico's aanzienlijk te vergroten.

Liangwei Yang, Shiyu Wang, Haolin Chen, Rithesh Murthy, Ming Zhu, Jielin Qiu, Zixiang Chen, Juntao Tan, Jianguo Zhang, Zhiwei Liu, Wenting Zhao, Silvio Savarese, Caiming Xiong, Huan Wang, Shelby Heinecke

Gepubliceerd 2026-03-05✓ Author reviewed
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat Large Language Models (LLMs) – die slimme AI's die we vandaag de dag gebruiken – als reusachtige, onzichtbare superkoks zijn. Deze koks kunnen van alles koken, maar ze hebben een heel specifieke manier om instructies te ontvangen.

Tot nu toe kunnen we deze koks alleen instructies geven door tekst te schrijven. Je zegt bijvoorbeeld: "Maak een recept voor een taart, maar maak het suikervrij en gebruik alleen biologische ingrediënten."

Deze tekst-instructies werken wel, maar ze hebben een groot probleem: ze zijn traag, onnauwkeurig en moeilijk te schalen. Als je de instructies steeds moet aanpassen om het resultaat perfect te krijgen, wordt de tekst steeds langer, rommeliger en onbetrouwbaarder. Het is alsof je een kok probeert te sturen door te fluisteren in zijn oor, terwijl hij in een drukke keuken staat. Soms begrijpt hij je niet, soms luistert hij niet, en soms vergeten ze wat je eerder zei.

De stelling van dit paper is simpel:
De makers van deze AI's (de "koks") moeten ons niet alleen de mogelijkheid geven om tekst te typen, maar ook speciale, onzichtbare "stuurknoppen" (vector prompts) te gebruiken.

Hier is hoe je dit kunt voorstellen:

1. De Tekst-instructie (Huidige situatie)

Stel je voor dat je een auto bestuurt met alleen een stem. Je moet hard roepen: "Ga linksaf, maar niet te hard, en zorg dat je de bomen niet raakt!"

  • Het probleem: Als je meer en meer details wilt toevoegen (bijvoorbeeld voor een heel specifieke route), wordt je geschreeuw steeds langer. De auto raakt in de war, vergeten wat je eerder zei, en het kost veel tijd en energie om de boodschap duidelijk te maken.
  • In de AI-wereld: Dit is wat we nu doen. We schrijven steeds langere prompts. De AI "saturatie" (raakt verzadigd): meer tekst helpt niet meer, het resultaat wordt niet beter.

2. De Vector-instructie (Het voorstel)

Nu stel je voor dat je in plaats van te roepen, een speciale afstandsbediening krijgt. Je drukt op een knop die direct een signaal naar de motor stuurt: "Snelheid: 80%, Koers: Noord-Noord-Oost, Vermijd: Bomen."

  • Het voordeel: Dit signaal is kort, krachtig en direct. Het is geen taal, maar een puur technisch commando dat de auto (de AI) direct begrijpt. Je kunt de instellingen heel fijn afstellen zonder dat de boodschap "vervuilt" door te veel woorden.
  • In de AI-wereld: Dit zijn de vector prompts. Het zijn getallenreeksen (vectoren) die direct de "hersenen" van de AI beïnvloeden, zonder dat er tussenkomst van taal nodig is.

Waarom is dit zo belangrijk? (De Analogie van de "Zwarte Doos")

Stel je voor dat je een gehuurde supercomputer hebt (de AI van een bedrijf). Je mag hem niet openmaken om de schroeven vast te draaien (dat is "fine-tuning", wat te duur en complex is). Je mag alleen praten met hem.

  • Huidig: Je moet hem overtuigen met steeds langere verhalen. Het werkt, maar het is onhandig.
  • Voorgesteld: De verhuurder geeft je een speciale sleutel (de vector prompt). Met deze sleutel kun je de machine heel precies instellen voor jouw specifieke taak, zonder dat je de machine zelf hoeft te bouwen of te huren.

Wat zeggen de onderzoekers?
Ze hebben gekeken naar hoe deze twee methoden werken:

  1. Tekst: Als je meer voorbeelden geeft (meer "supervisie"), stopt de tekst-instructie snel met verbeteren. Het is alsof je een emmer vult, maar de bodem lek is.
  2. Vector: Als je meer voorbeelden geeft, blijft de vector-instructie steeds beter worden. De emmer is niet lek; hij kan oneindig veel informatie opnemen.

Bovendien hebben ze gekeken naar hoe de AI "kijkt" naar de instructies:

  • Bij tekst kijkt de AI alleen naar een paar woorden en vergeet hij de rest snel.
  • Bij vectoren kijkt de AI naar de hele instructie als één krachtig blok. Het is alsof de tekst-instructie een vlinder is die op de wind drijft, en de vector-instructie een anker dat stevig in de grond staat.

Wat betekent dit voor de toekomst?

De onderzoekers roepen bedrijven op om deze "stuurknoppen" (vector prompts) openbaar te maken.

  • Voor bedrijven: Je kunt je eigen AI-specialist maken zonder miljoenen te investeren in nieuwe training. Je kunt je AI snel aanpassen aan nieuwe taken (bijv. van "schrijf e-mails" naar "analyseer juridische documenten") door simpelweg de vector-instructie te wisselen.
  • Voor veiligheid: Sommige mensen maken zich zorgen: "Als we deze knoppen geven, kunnen hackers de AI dan beter manipuleren?"
    De onderzoekers zeggen: Nee. Het is alsof je een auto geeft met een extra knop voor de radio. Je kunt de radio harder zetten, maar je kunt de auto niet plotseling laten vliegen. De "gevaarlijke" informatie die uit de AI komt, blijft hetzelfde; je kunt het alleen net iets efficiënter aansturen.

Kort samengevat:
We moeten stoppen met proberen AI's te sturen door ze steeds langere brieven te sturen. In plaats daarvan moeten we ze een afstandsbediening geven. Dit maakt het makkelijker, sneller en goedkoper om slimme AI's aan te passen aan onze specifieke behoeften, zonder dat we de hele machine hoeven te vervangen.