Session Risk Memory (SRM): Temporal Authorization for Deterministic Pre-Execution Safety Gates

Il documento presenta SRM (Session Risk Memory), un modulo deterministico e leggero che estende i gate di sicurezza per agenti da un controllo per singola azione a una valutazione temporale dell'intera sessione, eliminando i falsi positivi e rilevando attacchi distribuiti a bassa intensità con un overhead computazionale trascurabile.

Florin Adrian Chitan

Pubblicato 2026-03-25
📖 4 min di lettura☕ Lettura da pausa caffè

Each language version is independently generated for its own context, not a direct translation.

🛡️ Il Guardiano che Ricorda: Come SRM Protegge gli Agenti AI

Immagina di avere un guardiano molto intelligente (chiamato ILION) che controlla chi entra e cosa fa in un grande ufficio aziendale. Questo guardiano è bravissimo: controlla ogni singola richiesta che un assistente AI fa. Se l'assistente chiede qualcosa di chiaramente pericoloso (come "Cancella tutti i dati"), il guardiano dice subito: "STOP!".

Ma c'è un problema...

Il guardiano attuale ha un difetto: ha la memoria corta.
Ogni volta che l'assistente fa una domanda, il guardiano la guarda da sola, come se fosse l'unica cosa che è mai accaduta. Non ricorda cosa è successo 5 minuti fa.

Questo apre una porta pericolosa per i truffatori. Immagina un ladro che vuole rubare tutti i documenti dell'ufficio. Non può dire subito "Voglio rubare tutto", perché il guardiano lo fermerebbe.
Invece, il ladro fa così:

  1. Chiede di vedere un file (Sembra innocente).
  2. Chiede di copiarlo (Sembra normale).
  3. Chiede di comprimerlo in una cartella (Sembra utile).
  4. Chiede di inviarlo a un indirizzo esterno (Sembra un backup).

Ogni singolo passo, guardato da solo, sembra legittimo. Il guardiano "senza memoria" li lascia passare tutti. Ma se messi insieme, formano un furto perfetto.


🧠 L'Innovazione: SRM (La Memoria del Rischio)

Il paper introduce una nuova tecnologia chiamata SRM (Session Risk Memory).
Pensa all'SRM come al braccio destro del guardiano, quello che tiene un quaderno degli appunti durante l'intera giornata di lavoro.

Ecco come funziona, con una metafora semplice:

1. Il "Centro di Gravità" (La Rotta)

Immagina che ogni sessione di lavoro dell'AI sia come una barca che naviga.

  • All'inizio, la barca è ferma.
  • Ogni volta che l'AI fa un'azione, l'SRM aggiorna la posizione della barca.
  • Se l'AI fa cose normali (come un dipendente che lavora), la barca oscilla un po' ma rimane nella sua "corsa normale".
  • Se l'AI inizia a fare cose strane (anche se piccole), la barca inizia a deviare dalla rotta.

L'SRM calcola questa deviazione. Non guarda se un singolo passo è sbagliato, ma guarda se la barca sta uscendo dal canale sicuro.

2. Il "Termometro del Rischio" (La Media Mobile)

L'SRM non si fida subito di un singolo movimento strano. Usa un trucco intelligente:

  • Fase di riscaldamento: Nei primi 3 passi, l'SRM osserva cosa fa l'AI per capire qual è il suo "comportamento normale" (la sua linea di base).
  • L'allarme: Se dopo i primi 3 passi, l'AI inizia a fare cose che si discostano da quella linea di base, l'SRM alza il "termometro del rischio".
  • La regola d'oro: Se il rischio sale troppo e rimane alto, l'SRM blocca tutto, anche se ogni singolo passo sembrava innocuo da solo.

3. Perché è Geniale?

  • Non è un mago: Non usa intelligenza artificiale complessa che impara e sbaglia. È matematica pura e veloce (come un calcolo veloce su un foglio di carta).
  • È velocissimo: Aggiunge meno di un millesimo di secondo di ritardo. L'utente non se ne accorge nemmeno.
  • Non si sbaglia: Nel test fatto dagli autori, il sistema vecchio (senza memoria) sbagliava il 5% delle volte (bloccava gente innocente o lasciava passare rischi). Il nuovo sistema (con SRM) ha fatto zero errori: ha bloccato tutti i ladri e non ha mai fermato i dipendenti onesti.

🎯 In Sintesi: Due Tipi di Sicurezza

Il paper ci insegna che la sicurezza ha due dimensioni, come un cubo:

  1. Sicurezza Spaziale (Il Guardiano): "Questa singola azione è permessa?" (Guarda il singolo punto).
  2. Sicurezza Temporale (L'SRM): "Questa sequenza di azioni ha senso nel tempo?" (Guarda la linea che collega i punti).

L'analogia finale:
Immagina di essere in una casa.

  • Il Guardiano controlla se stai aprendo la porta di casa con la chiave giusta.
  • L'SRM controlla se, dopo aver aperto la porta, inizi a camminare verso la cassaforte, a prendere gli occhiali da sole, a mettere i guanti e a scappare dalla finestra.

Da soli, questi gesti sembrano strani ma non illegali. Insieme, sono un furto. L'SRM è l'unico che riesce a vedere il "film completo" e a fermare il ladro prima che scappi con il bottino.

🏆 Il Risultato

Grazie a questa "memoria temporale", il sistema è diventato perfetto nel test:

  • 100% di ladri fermati.
  • 0% di dipendenti onesti fermati per errore.
  • Tutto questo senza rallentare il lavoro.

È come avere un guardiano che non solo ha gli occhi aperti, ma ha anche la memoria di cosa è successo 5 minuti fa, rendendo l'ufficio digitale molto più sicuro contro i truffatori pazienti.