Reducing Cost of LLM Agents with Trajectory Reduction

Il paper introduce AgentDiet, un approccio di riduzione delle traiettorie a tempo di inferenza che elimina automaticamente le informazioni ridondanti negli agenti LLM per software engineering, riducendo significativamente i costi computazionali e il numero di token di input senza compromettere le prestazioni.

Yuan-An Xiao, Pengfei Gao, Chao Peng, Yingfei Xiong

Pubblicato 2026-03-17
📖 4 min di lettura☕ Lettura da pausa caffè

Each language version is independently generated for its own context, not a direct translation.

Immagina di assumere un assistente personale super-intelligente (un'Intelligenza Artificiale) per risolvere un problema complesso, come riparare un bug in un software o scrivere un programma.

Il Problema: L'Assistente che si "ingozza" di ricordi

Finora, c'era un grosso difetto in questi assistenti: avevano una memoria troppo fedele e poco selettiva.

Ogni volta che l'assistente faceva qualcosa (ad esempio, controllava un file, eseguiva un comando o leggeva un messaggio di errore), scriveva tutto ciò che era successo in un diario di bordo (chiamato "traiettoria").

  • Se l'assistente leggeva un file enorme, il diario si riempiva di quel file.
  • Se eseguiva un comando che produceva 100 righe di testo, il diario si riempiva di quelle 100 righe.
  • Se l'assistente faceva un errore e poi lo correggeva, il diario conservava sia l'errore sia la correzione.

Il risultato? Dopo pochi passi, il diario diventava un muro di carta enorme.
Quando l'assistente doveva pensare al passo successivo, doveva leggere tutto quel muro di carta, anche le parti irrilevanti (come i file di sistema inutili o i messaggi di conferma che dicevano "fatto, fatto, fatto").
Questo rendeva due cose molto costose:

  1. Lentezza: Leggere montagne di carta richiede tempo.
  2. Costo: Ogni parola letta costa denaro (le aziende pagano per ogni parola che l'AI elabora).

È come se dovessi leggere un'enciclopedia intera ogni volta che vuoi sapere cosa hai mangiato a colazione, solo perché l'enciclopedia contiene anche la ricetta della colazione.

La Soluzione: "AgentDiet" (La Dieta dell'Agente)

Gli autori di questo studio hanno creato un metodo chiamato AgentDiet.
Il nome è un gioco di parole: è una "dieta" per l'agente AI.

Come funziona?
Immagina che l'assistente abbia un segretario personale (chiamato "modulo di riflessione") che lavora per lui.
Mentre l'assistente principale sta lavorando, il segretario guarda il diario di bordo e dice:

"Ehi, aspetta un attimo. Questa riga dice che hai aperto una cartella piena di file di sistema inutili. Non serve più. Cancelliamola e lasciamo solo un riassunto: 'Ho controllato i file'. E questa altra riga è una lista di 50 test passati? Tutti verdi? Cancelliamola e scriviamo solo '50 test passati con successo'."

Il segretario rimuove il "rifiuto" (informazioni inutili, ridondanti o scadute) e lascia solo l'essenziale.

Perché è geniale?

  1. Risparmia soldi: Meno parole da leggere significa meno costi. Il paper dimostra che si può risparmiare dal 21% al 36% del costo totale.
  2. Non perde efficacia: L'assistente principale non diventa stupido. Anzi, togliendo il "rumore" di fondo, riesce a concentrarsi meglio sui problemi reali. È come togliere la polvere da uno specchio: si vede meglio.
  3. È automatico: Non serve che l'assistente principale sappia di essere "dietato". Il segretario lavora in silenzio, pulendo il diario mentre l'assistente continua a lavorare.

L'Analogia della Cucina

Immagina di cucinare una cena complessa.

  • Senza AgentDiet: Ogni volta che tagli un cipollone, butti la buccia, l'acqua di cottura e il guscio dell'uovo nel piatto principale. Alla fine, il piatto è un mucchio di rifiuti che devi mescolare per trovare il cibo vero. È disordinato e pesante.
  • Con AgentDiet: C'è un aiutante che, mentre tu cucini, butta subito i rifiuti nel cestino e ti lascia solo gli ingredienti puliti nel piatto. Il risultato finale è lo stesso (la cena è buona), ma il lavoro è più pulito, veloce ed economico.

I Risultati in Pillole

Gli autori hanno testato questa "dieta" su agenti che risolvono problemi di programmazione reali.

  • Hanno ridotto la quantità di informazioni lette dell'AI del 40-60%.
  • Hanno risparmiato quasi un terzo dei soldi spesi per far funzionare l'AI.
  • La cosa più importante: L'AI ha risolto gli stessi problemi, con la stessa qualità, senza farsi confondere. Anzi, in alcuni casi, è diventata più veloce perché non si è "intasata" di informazioni inutili.

Conclusione

In sintesi, questo paper ci insegna che non serve avere più memoria per essere più intelligenti. A volte, per essere più efficienti ed economici, basta imparare a buttare via il superfluo. AgentDiet è il primo passo verso assistenti AI più snelli, veloci ed economici, pronti per essere usati da tutti senza spendere una fortuna.

Sommerso dagli articoli nel tuo campo?

Ricevi digest giornalieri degli articoli più recenti corrispondenti alle tue parole chiave di ricerca — con riassunti tecnici, nella tua lingua.

Prova Digest →