Each language version is independently generated for its own context, not a direct translation.
Wat is het probleem?
Stel je voor dat je een gesprek voert met een slimme robot (een AI). Soms wil je dat de robot op een specifieke manier praat. Bijvoorbeeld:
- "Praat alsof je een boze klant bent."
- "Leg het uit alsof ik 5 jaar oud ben."
- "Gebruik heel moeilijke woorden."
Het probleem is dat robots vaak vergeten wat ze moeten doen zodra het gesprek langer duurt. Als je ze alleen een opdracht geeft aan het begin (zoals "Wees aardig"), vergeten ze dat vaak na een paar zinnen. Als je ze voorbeelden geeft (zoals "Kijk hoe ik hier reageer"), werkt dat vaak ook niet goed als het gesprek al lang is, omdat de robot dan verstrikt raakt in de oude voorbeelden.
De Oplossing: Retcon (De "Terug in de Tijd"-Techniek)
De auteurs van dit paper hebben een nieuwe manier bedacht die ze Retcon noemen. De naam komt uit strips en films: een retcon (retroactive continuity) is wanneer je een bestaand verhaal herschrijft om een nieuwe plotlijn toe te voegen.
De Metafoor: De Regisseur met een Telefoon
Stel je voor dat je een toneelstuk speelt met een acteur (de AI).
- De oude manier (Few-shot): Je geeft de acteur een script met drie voorbeelden van hoe hij moet spelen. Daarna laat je hem het stuk spelen. Als het stuk lang duurt, vergeet hij vaak de instructies uit het script.
- De Retcon-methode: Je bent de regisseur. Je staat niet alleen aan het begin, maar je loopt tijdens het hele stuk langs de acteur. Voor elke zin die de acteur zegt, fluister je hem in zijn oor: "Oké, nu moet je heel boos klinken" of "Nu moet je heel simpel praten".
Je "schrijft" het gesprek dus in real-time om. Je voegt een instructie toe voor elke draai in het gesprek, niet alleen voor de voorbeelden.
Hoe werkt het precies?
In plaats van dat je de AI een paar volledige gesprekken als voorbeeld geeft, geef je de AI een lijst met alle zinnen uit die gesprekken, maar met een klein labeltje erbovenop.
- Voorbeeld: In plaats van te zeggen: "Hier is een gesprek van 10 zinnen, en de laatste zin was goed."
- Retcon: Zeg je: "Hier is zin 1 (met instructie), hier is zin 2 (met instructie), hier is zin 3 (met instructie)..."
Zo ziet de AI voor elke zin een voorbeeld van hoe hij moet reageren op een specifieke opdracht. Het is alsof je de AI een spiegel voorhoudt bij elke stap die hij zet.
Wat hebben ze ontdekt?
De auteurs hebben dit getest met een taak waarbij de AI moest praten op verschillende moeilijkheidsniveaus (van heel simpel tot heel moeilijk, zoals voor een taalstudent).
- Het resultaat: Retcon werkt veel beter dan de oude methoden.
- De verrassing: Zelfs als je Retcon gebruikt met minder voorbeeldgesprekken dan de andere methode, wint het vaak.
- Waarom? Omdat de instructies "verser" zijn. De AI hoeft niet te gissen wat hij moet doen na 20 zinnen; hij krijgt bij elke nieuwe zin een herinnering.
De Kooltjes en de Aardappelen (De Nadelen)
Natuurlijk is er een prijs te betalen.
- Meer werk: Je moet een extra "controle-model" hebben dat elke zin meet om te zien of hij wel goed is. Dit is alsof je naast de regisseur een critici hebt die elke zin direct nakijkt.
- Langer gesprek: Omdat je bij elke zin een instructie toevoegt, wordt het bericht dat naar de AI gaat erg lang. Dit kost meer rekenkracht en tijd.
Conclusie
Retcon is een slimme truc om robots beter te laten luisteren tijdens lange gesprekken. In plaats van ze een opdracht te geven en te hopen dat ze het niet vergeten, geef je ze bij elke stap een herinnering. Het is alsof je een robot niet alleen een kaart geeft, maar hem bij elke afslag ook even de weg wijst.
Het is een beetje meer werk om het op te zetten, maar het resultaat is een veel gehoorzamender en preciezer gesprekspartner.