AegisUI: Behavioral Anomaly Detection for Structured User Interface Protocols in AI Agent Systems

Dit paper introduceert AegisUI, een framework dat structurele en semantische afwijkingen in UI-protocol-payloads detecteert om gedragsmatige manipulaties te identificeren die traditionele schema-validaties ontlopen, waarbij een Random Forest-model de beste prestaties boekte op een dataset van 4000 gelabelde payloads.

Mohd Safwan Uddin, Saba Hajira

Gepubliceerd 2026-03-06
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een zeer slimme, digitale assistent hebt die voor jou een website of een app-interface bouwt. Je vraagt: "Maak een formulier om een hotel te boeken," en de assistent pakt zijn digitale bouwstenen: knoppen, tekstvakken, tabellen. Hij legt ze neer volgens een strak plan (een "protocol") en je ziet een mooie, werkende pagina.

Het probleem? Wat als die assistent niet meer alleen maar bouwt, maar bedriegt?

Stel je voor dat de assistent een knop maakt met de tekst "Betaal de rekening", maar als je erop klikt, wordt in plaats daarvan je hele bankrekening leeggemaakt. Of hij toont een formulier dat eruitziet als een normale login, maar in het geheim je wachtwoord naar een hacker stuurt.

De huidige beveiliging kijkt alleen of de bouwstenen wel op de juiste plek zitten (is het een knop? Ja. Is het een tekstveld? Ja.). Maar ze kijken niet of wat er staat overeenkomt met wat er gebeurt.

Hier komt AegisUI in beeld. Dit is een nieuw systeem dat als een super-scherpe inspecteur fungeert voordat de pagina überhaupt voor jou wordt getoond.

Hoe werkt AegisUI? (De Analogie van de Valspeurder)

Stel je voor dat AegisUI een veiligheidscontroleur op een luchthaven is, maar dan voor digitale bouwplannen.

  1. De Bouwplannen (Payloads): De AI-agent levert een bouwplan aan. Normaal gesproken is dit een lijst met instructies: "Hier een knop, daar een tekstvak."
  2. De Valstrikken (Aanvallen): Kwaadwillenden kunnen dit plan manipuleren. Ze kunnen:
    • Verborgen laden toevoegen: Een knop die eruitziet als "Verder", maar in feite je creditcardgegevens steelt.
    • Geheime schakelaars: Een widget die normaal je saldo toont, maar nu per ongeluk (of opzettelijk) je salarisgegevens van een ander laat zien.
    • De "Verkeerde" Knop: Een knop met de tekst "Bevestig", die in de achtergrond je account verwijdert.
  3. De Inspectie (AegisUI): Voordat het plan naar de gebruiker gaat, pakt AegisUI het bouwplan en kijkt niet alleen naar de vorm, maar naar het gedrag.
    • Vraag: "Waarom heeft deze knop een label 'Veilig' maar een actie 'Verwijder alles'?"
    • Vraag: "Waarom is dit formulier plotseling zo diep en ingewikkeld?"
    • Vraag: "Zit hier een tekstvak voor 'Wachtwoord' in een boekingspagina voor een hotel?"

De Drie Detectiemethoden

De onderzoekers hebben drie verschillende "detectives" getest om deze valstrikken te vinden:

  1. De Isolation Forest (De "Vreemde Vogel" Detector):

    • Hoe het werkt: Deze kijkt naar de vorm van het bouwplan. Als een plan er heel anders uitziet dan duizenden andere normale plannen (bijvoorbeeld veel te veel lagen of vreemde vertakkingen), denkt hij: "Aha, dit is een vreemde vogel!"
    • Resultaat: Goed voor grove fouten, maar mist subtiele bedriegers die er netjes uitzien.
  2. De Autoencoder (De "Normaal Gedrag" Trainer):

    • Hoe het werkt: Deze detective heeft nooit een crimineel gezien. Hij heeft alleen duizenden normale bouwplannen bestudeerd. Hij leert hoe een "gezond" plan eruitziet. Als hij nu een plan krijgt dat hij niet goed kan nabootsen (want het bevat vreemde elementen), zegt hij: "Dit klopt niet, dit is verdacht!"
    • Resultaat: Zeer handig als je nog geen lijst met bekende criminelen hebt. Hij ziet afwijkingen in het patroon.
  3. De Random Forest (De "Ervaarde Expert"):

    • Hoe het werkt: Deze heeft een enorme map met voorbeelden van zowel normale plannen als bekende aanvalspatronen. Hij kijkt naar 18 verschillende details (zoals hoeveel knoppen er zijn, hoe lang de tekst is, of er gevoelige woorden in staan) en vergelijkt ze met zijn ervaring.
    • Resultaat: De beste van allemaal. Hij is het meest accuraat en mist de minste bedriegers, maar hij heeft wel een lijst met bekende misdaden nodig om te leren.

Wat hebben ze ontdekt?

De onderzoekers hebben 4.000 bouwplannen gegenereerd (3.000 normale en 1.000 met valstrikken) om hun systeem te testen.

  • Het makkelijkst te vangen: Aanvallen waarbij de structuur heel raar wordt (bijvoorbeeld een formulier dat 50 lagen diep is). Dat is als een auto die 10 wielen heeft; je ziet het direct.
  • Het moeilijkst te vangen: Aanvallen waarbij alleen de tekst op één knop verandert, maar de rest perfect normaal is. Dit is als een kameleon die op een boom zit; hij ziet eruit als de boom, maar is gevaarlijk.
  • De beste oplossing: De "Ervaarde Expert" (Random Forest) deed het het beste, maar de "Normaal Gedrag Trainer" (Autoencoder) is de meest praktische oplossing voor nieuwe systemen die nog geen ervaring met aanvallen hebben.

Waarom is dit belangrijk?

Vroeger waren websites statisch: een mens bouwde ze, keek ze na en bracht ze uit. Nu bouwen AI-agenten ze live. Als die agenten gehackt worden of fouten maken, kunnen ze onmiddellijk gevaarlijke interfaces voor jou bouwen.

AegisUI is de tussenpersoon die zegt: "Wacht even, dit bouwplan ziet er netjes uit, maar de bedoeling van deze knop klopt niet met de tekst. Ik laat dit niet door."

Het is een eerste stap om te zorgen dat de AI's die onze digitale wereld bouwen, niet per ongeluk (of opzettelijk) de deuren openzetten voor criminelen. De onderzoekers hebben hun code en data vrijgegeven, zodat iedereen dit kan testen en verbeteren.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →