KAIJU: An Executive Kernel for Intent-Gated Execution of LLM Agents

Dit artikel introduceert KAIJU, een systeem dat de uitvoering van LLM-agenten ontkoppelt van de redeneringslaag via een Executive Kernel en Intent-Gated Execution (IGX) om parallelle verwerking, betere beveiliging en schaalbaarheid te realiseren.

Cormac Guerin, Frank Guerin

Gepubliceerd 2026-04-07
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

🦖 KAIJU: De Regisseur die de Acteurs niet Laat Doen Wat Ze Willen

Stel je voor dat je een grote film moet maken. Je hebt een briljante regisseur (de AI) die een geweldig script schrijft, maar die regisseur is ook een beetje onvoorspelbaar. Hij kan soms vergeten wat hij beloofde, hallucineren dat hij een explosie kan maken terwijl hij dat niet mag, of hij kan de camera te lang vasthouden waardoor de film te duur wordt.

Tot nu toe werkten AI-agenten (zoals die in ChatGPT of Claude) als een eenmansshow: de regisseur schrijft een zin, roept een acteur op, kijkt naar het resultaat, schrijft de volgende zin, en zo verder. Dit heet ReAct.

KAIJU is een nieuw systeem dat deze chaos oplost. Het introduceert een uitvoeringskern (een Executive Kernel) die de regisseur en de acteurs scheidt. Hier is hoe het werkt, vertaald naar alledaagse beelden:

1. Het Probleem: De "Gespreksbubbel" die te vol raakt

Bij de oude manier (ReAct) moet de regisseur bij elke stap het hele script van de vorige scènes meenemen.

  • Metafoor: Stel je voor dat je een gesprek voert, maar bij elke zin die je zegt, moet je ook de volledige tekst van het gesprek van gisteren, eergisteren en de week daarvoor opnieuw voorlezen.
  • Gevolg: Bij complexe taken wordt dit gesprek zo lang en duur dat de AI het verliest, dure fouten maakt, of simpelweg "opgeeft" omdat het te veel tekst is om te verwerken. Ook is de AI te machtig: als hij zegt "ik ga een gevaarlijke knop indrukken", doet hij het vaak gewoon, tenzij je hem heel streng in de gaten houdt (wat hij soms negeert).

2. De Oplossing: KAIJU als een Strakke Productie

KAIJU splitst het werk op in twee lagen:

  1. De Regisseur (LLM): Deze denkt alleen na over het plan. Hij maakt een kaart (een grafiek) van wat er gedaan moet worden, maar ziet niet hoe het gebeurt.
  2. De Uitvoeringskern (KAIJU): Dit is de strenge producer. Hij pakt het plan, regelt de acteurs, zorgt dat ze niet in de weg lopen, en controleert of alles veilig is.

De Regisseur ziet de producer niet. Hij weet niet of een actie wordt goedgekeurd of geweigerd. Hij maakt gewoon een plan. De producer voert het uit.

3. De "Intent-Gated Execution" (IGX): De Vierde Poort

Voordat er ook maar iets gebeurt, moet elke actie door een veiligheidspoort. Dit is geen gesprek; het is een harde code-check. De poort kijkt naar vier dingen:

  1. Scope (Wie mag wat?): Mag deze AI überhaupt deze tool gebruiken? (Bijv. mag hij alleen zoeken, maar niet wissen?)
  2. Intent (Wie vraagt het?): Vraagt een simpele gebruiker dit (laag risico) of een beheerder (hoog risico)?
  3. Impact (Wat is het effect?): Is het een "lezen"-actie (veilig) of een "wissen"-actie (gevaarlijk)?
  4. Clearance (Uitwendige toestemming): Is er een externe goedkeuring nodig? (Bijv. "Mag deze drone in dit luchtruim vliegen?").

De magische truc: Als de poort "Nee" zegt, ziet de AI dit niet als een "Nee" van de poort. Hij ziet het gewoon als een "Foutje". De AI kan dus niet proberen de poort te omzeilen door te zeggen: "Oh, ik probeer het nog een keer met andere woorden." De poort is onzichtbaar en onneembaar voor de AI.

4. De Drie Manieren van Werken (De "Modes")

KAIJU kan op drie manieren werken, afhankelijk van hoe complex de taak is:

  • Reflect (De Golfbewaker): De AI werkt in golven. Eerst doet hij een reeks taken tegelijk (zoals het checken van de weer, de nieuws en de mail). Dan stopt hij even, kijkt naar de resultaten, en beslist: "Moet ik nog meer doen?" Pas dan gaat hij naar de volgende golf. Dit voorkomt dat het gesprek te lang wordt.
  • nReflect (De Teller): Hij werkt in blokken. Bijvoorbeeld: "Na elke 5 taken kijk ik even of het nog goed gaat." Dit is snel en efficiënt.
  • Orchestrator (De Regisseur op de set): Hier kijkt er een kleine "observer" naar elke individuele actie terwijl deze gebeurt. Als een actie mislukt, wordt er direct iets anders geprobeerd. Dit is het meest nauwkeurig, maar ook het duurst.

5. Waarom is dit beter? (De Resultaten)

In de tests bleek KAIJU superieur aan de oude manier:

  • Snelheid bij complexe taken: Omdat KAIJU dingen parallel doet (zoals een orkest dat tegelijk speelt in plaats van één voor één), is het veel sneller bij moeilijke vragen. De oude manier (ReAct) raakt hierdoor in de problemen omdat het script te lang wordt.
  • Geen "opgeven": Als een AI bij de oude manier een tool niet kan gebruiken, zegt hij vaak: "Oké, ik ga het maar raden." KAIJU probeert het automatisch op een andere manier of zoekt een alternatief. Hij geeft niet op.
  • Veiligheid: Omdat de AI de veiligheidsregels niet kan zien of bespotten, is het veel moeilijker om de AI te misleiden om gevaarlijke dingen te doen.

Samenvatting in één zin

KAIJU is als het verschil tussen een regisseur die zelf alle acteurs aanstuurt (en soms de regels negeert) en een regisseur die een strak plan schrijft voor een onafhankelijke, onneembare producer die zorgt dat alles veilig, snel en volgens plan gebeurt, zonder dat de regisseur weet of hij een "nee" heeft gekregen.

Het maakt AI-agenten sneller, veiliger en betrouwbaarder, vooral bij moeilijke taken waar veel stappen nodig zijn.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →