Prism-Δ\Delta: Differential Subspace Steering for Prompt Highlighting in Large Language Models

Het artikel introduceert PRISM-Δ\Delta, een methode die door het decomponeren van covariantiematrices en het toewijzen van gewichten aan attention heads de precisie van prompt-highlighting in grote taalmodellen aanzienlijk verbetert, terwijl het tegelijkertijd de vloeiendheid behoudt en compatibel is met FlashAttention.

Yuyao Ge, Shenghua Liu, Yiwei Wang, Tianyu Liu, Baolong Bi, Lingrui Mei, Jiayu Yao, Jiafeng Guo, Xueqi Cheng

Gepubliceerd 2026-03-12
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een zeer intelligente, maar soms wat verwarde assistent hebt. Je geeft hem een lange tekst en zegt: "Kijk vooral naar dit ene stukje, want daar staat het antwoord." Maar de assistent kijkt soms toch maar naar de hele tekst, of verwardt de belangrijke stukjes met de onbelangrijke.

Dit is het probleem dat PRISM-∆ (uitgesproken als "Prisma Delta") oplost voor grote taalmodellen (zoals AI-chatbots).

Hier is een simpele uitleg van wat ze hebben bedacht, met behulp van alledaagse vergelijkingen.

1. Het Probleem: De Verkeerde Wegwijzer

Stel je voor dat de AI een enorme bibliotheek is. Als je vraagt om een specifiek boek, wil je dat de AI alleen naar dat ene boek kijkt en de rest negeert.

Bestaande methoden proberen dit te doen door de "wijzer" van de AI te verdraaien. Ze zeggen: "Kijk hierheen!" Maar ze vergeten iets belangrijks:

  • De Wijzer (Key): Waar de AI naar kijkt.
  • De Inhoud (Value): Wat de AI daadwerkelijk leest en onthoudt.

De oude methoden deden alsof ze alleen de wijzer verdraaiden, maar ze veranderden niet wat er in het boek stond. Het was alsof je iemand wijst naar een boek, maar het boek zelf is nog steeds dicht. De AI kijkt wel naar de juiste plek, maar begrijpt de inhoud niet goed genoeg.

2. De Oplossing: PRISM-∆ (De Slimme Filter)

PRISM-∆ is een nieuwe techniek die twee dingen tegelijk doet:

  1. Het verbetert de wijzer (zodat de AI echt naar het juiste stukje kijkt).
  2. Het verbetert de inhoud (zodat de AI de boodschap van dat stukje ook echt begrijpt).

Hoe werkt het? De "Verschil-Filter"

Stel je voor dat je twee groepen mensen hebt:

  • Groep A: Mensen die een vraag goed beantwoorden.
  • Groep B: Mensen die dezelfde vraag verkeerd beantwoorden.

Als je kijkt naar wat deze groepen allebei denken, zie je veel gemeenschappelijke gedachten (bijvoorbeeld: "Het is een schoolvraag"). Dat is niet nuttig.
Wat je echt wilt weten, is: Wat is het unieke verschil tussen de groep die het goed doet en de groep die het fout doet?

PRISM-∆ gebruikt een wiskundige truc (die ze "differential subspace steering" noemen) om precies dat verschil eruit te halen. Het filtert alle "ruis" en gemeenschappelijke gedachten weg en houdt alleen de pure, unieke signalen over die het verschil maken.

3. De "Dimmerknop" voor elke AI-deel

Een groot taalmodel bestaat uit duizenden kleine onderdelen (we noemen ze "hoofden" of heads). Sommige zijn heel slim en helpen veel, andere zijn wat slaperig of maken zelfs fouten.

  • Oude methode: Ze deden alsof alle hoofden even belangrijk waren. Ze schakelden de "slechte" hoofden soms helemaal uit, maar dat was te grof.
  • PRISM-∆ methode: Ze geven elke hoofd een dimmerknop.
    • Een heel slim hoofd krijgt de knop op 100% (voluit).
    • Een wat minder slim, maar nog steeds nuttig hoofd krijgt de knop op 40%.
    • Een verwarrend hoofd krijgt de knop op bijna 0%.

Dit zorgt ervoor dat de AI soepeler werkt en niet "schokkerig" wordt door slechte signalen.

4. Waarom is dit zo goed?

  • Sneller en Lichter: Het kost bijna geen extra tijd of geheugen. Het is alsof je een bril opzet die je niet zwaarder maakt.
  • Beter Begrip: Omdat ze ook de "inhoud" (Value) aanpassen, niet alleen de "wijzer" (Key), is het antwoord van de AI vaak accurater en natuurlijker.
  • Langere Teksten: Het werkt zelfs als je een heel lang document geeft (bijvoorbeeld 30 pagina's) en het antwoord ergens in het midden zit. De AI raakt dan niet meer "kwijt" in het midden van de tekst.

Samenvattend in één zin:

PRISM-∆ is als een slimme bril die de AI helpt om precies naar het juiste stukje tekst te kijken én precies te begrijpen wat er staat, terwijl het alle afleidende ruis en verwarrende signalen filtert, zonder de AI te vertragen.

Het is een manier om de AI te zeggen: "Kijk hier, en luister goed naar wat er staat, maar negeer alles wat niet belangrijk is."