Agent Data Protocol: Unifying Datasets for Diverse, Effective Fine-tuning of LLM Agents

Questo lavoro introduce l'Agent Data Protocol (ADP), un linguaggio di rappresentazione leggero che unifica dataset eterogenei per agenti AI, consentendo un addestramento supervisionato scalabile che migliora le prestazioni dei modelli di base del 20% e raggiunge risultati all'avanguardia su benchmark di coding, navigazione e utilizzo di strumenti senza necessità di ottimizzazioni specifiche per dominio.

Yueqi Song, Ketan Ramaneti, Zaid Sheikh, Ziru Chen, Boyu Gou, Tianbao Xie, Yiheng Xu, Danyang Zhang, Apurva Gandhi, Fan Yang, Joseph Liu, Tianyue Ou, Zhihao Yuan, Frank Xu, Shuyan Zhou, Xingyao Wang, Xiang Yue, Tao Yu, Huan Sun, Yu Su, Graham Neubig

Pubblicato 2026-03-05
📖 4 min di lettura☕ Lettura da pausa caffè

Each language version is independently generated for its own context, not a direct translation.

Immagina di voler insegnare a un robot (un'intelligenza artificiale) a fare il "magazziniere" o il "programmatore" di un supermercato. Il robot deve saper aprire le scatole, cercare prodotti sugli scaffali, usare un computer per fare gli ordini e parlare con i clienti.

Il problema è che, finora, ogni squadra di ricercatori ha raccolto le sue istruzioni in modo diverso:

  • La squadra A ha scritto tutto su foglietti di carta con una grafia strana.
  • La squadra B ha registrato video di come il robot si muoveva.
  • La squadra C ha usato un linguaggio di codice che solo loro capivano.

Se vuoi addestrare il tuo robot, dovresti imparare tre lingue diverse e tradurre manualmente ogni foglietto, ogni video e ogni codice. È un lavoro enorme, lento e spesso impossibile.

La soluzione proposta in questo paper è come un "Traduttore Universale" o un "Lego Standard".

Ecco come funziona, spiegato in modo semplice:

1. Il Problema: Il Caos dei Dati

Gli scienziati hanno raccolto tantissimi dati su come gli agenti AI (robot software) risolvono problemi. Ma questi dati sono frammentati. È come avere 13 scatole di Lego diverse: una ha i mattoncini rossi quadrati, l'altra ha quelli blu tondi, un'altra ha pezzi di legno. Anche se tutti sono "Lego", non puoi costruire una grande città mescolandoli direttamente perché non si incastrano.

2. La Soluzione: Il Protocollo ADP (Agent Data Protocol)

Gli autori hanno creato un nuovo linguaggio, chiamato ADP, che funziona come un linguaggio universale (o un "interlingua").

  • L'Analogia del Traduttore: Immagina che ADP sia un traduttore istantaneo. Prende i "foglietti" della squadra A, i "video" della squadra B e i "codici" della squadra C e li trasforma tutti nella stessa lingua semplice: "Azione" e "Osservazione".
    • Azione: Cosa fa il robot? (Es. "Clicca qui", "Scrivi questo codice", "Chiedi aiuto").
    • Osservazione: Cosa vede il robot dopo? (Es. "La pagina web è cambiata", "Il codice ha funzionato", "Il cliente ha risposto").

Una volta che tutto è scritto in questo linguaggio universale, non importa da dove venisse il dato originale. Tutti i pezzi Lego ora hanno la stessa forma e si incastrano perfettamente!

3. Il Risultato: Una Grande Città di Lego

Grazie a questo protocollo, gli scienziati hanno preso 13 dataset diversi (che prima non si potevano mischiare) e li hanno uniti in un unico, gigantesco dataset di 1,3 milioni di esempi.

Hanno poi insegnato al loro "robot" (un modello linguistico) usando questo mix enorme. Il risultato è stato incredibile:

  • Il robot è diventato molto più intelligente (circa il 20% in più rispetto a prima).
  • È diventato bravo in tutto: a scrivere codice, a navigare su internet, a usare strumenti e a fare ricerche, senza bisogno di essere addestrato separatamente per ogni compito.

4. Perché è importante per tutti?

Prima di ADP, se volevi creare un nuovo robot per un compito specifico, dovevi riscrivere tutto il codice per far funzionare i dati di ogni singola squadra. Era come dover costruire un nuovo adattatore per ogni presa elettrica diversa nel mondo.

Con ADP:

  • Risparmio di tempo: Basta un solo adattatore (il protocollo) per collegare qualsiasi fonte di dati a qualsiasi robot.
  • Collaborazione: Chiunque può aggiungere nuovi dati. Se trovi un nuovo dataset, lo trasformi in ADP e boom, è subito utile per tutti gli altri ricercatori.
  • Accessibilità: Anche chi non è un esperto di ingegneria può usare questi dati per creare robot intelligenti.

In sintesi

Questo paper dice: "Non ci mancano i dati per insegnare agli agenti AI, ci manca solo un modo per parlarci tutti la stessa lingua."

Hanno creato quella lingua (ADP), hanno mescolato tutti i dati esistenti e hanno dimostrato che, quando un robot impara da una varietà enorme di esperienze (codice, web, strumenti), diventa molto più capace e versatile di uno che ha studiato solo un tipo di compito. È come se un bambino imparasse non solo a fare i compiti di matematica, ma anche a cucinare, a giocare a calcio e a parlare con gli amici: diventerebbe un adulto molto più preparato per la vita reale.