Agent Data Protocol: Unifying Datasets for Diverse, Effective Fine-tuning of LLM Agents

Dit paper introduceert het Agent Data Protocol (ADP), een lichtgewicht representatietaal die verspreide agentdatasets standaardiseert, waardoor efficiënter fine-tuning mogelijk wordt met aanzienlijke prestatieverbeteringen op diverse taken zonder domeinspecifieke aanpassingen.

Yueqi Song, Ketan Ramaneti, Zaid Sheikh, Ziru Chen, Boyu Gou, Tianbao Xie, Yiheng Xu, Danyang Zhang, Apurva Gandhi, Fan Yang, Joseph Liu, Tianyue Ou, Zhihao Yuan, Frank Xu, Shuyan Zhou, Xingyao Wang, Xiang Yue, Tao Yu, Huan Sun, Yu Su, Graham Neubig

Gepubliceerd 2026-03-05
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een super-intelligente robot wilt bouwen die niet alleen tekst kan schrijven, maar ook echt werk kan doen: software programmeren, op het internet zoeken, bestanden beheren en complexe taken uitvoeren. Dit noemen we een "AI-agent".

Het probleem is dat er al duizenden voorbeelden zijn van hoe deze robots taken uitvoeren. Maar deze voorbeelden liggen verspreid over de hele wereld in verschillende "talen" en formaten. Het is alsof je duizenden recepten hebt, maar sommige zijn geschreven in het Frans, andere in het Japans, weer anderen in een eigen code die niemand anders begrijpt. Als je een chef-kok wilt worden die van al deze recepten kan leren, moet je ze eerst allemaal vertalen naar één standaardtaal voordat je kunt koken. Dat proces is tot nu toe extreem moeilijk en tijdrovend geweest.

Dit is precies wat het nieuwe onderzoek "Agent Data Protocol" (ADP) oplost.

Hier is een simpele uitleg van wat ze hebben gedaan, met een paar creatieve vergelijkingen:

1. Het Probleem: De "Talenbarrière" in de Robotwereld

Vroeger was het zo dat elke groep onderzoekers hun eigen manier van data verzamelen had.

  • Groep A hield bij wat de robot deed in een Excel-sheet.
  • Groep B schreef het op in een heel specifiek computerprogramma.
  • Groep C gebruikte een andere manier om te beschrijven hoe de robot op een website klikte.

Als je een nieuwe robot wilde trainen, moest je eerst een heleboel ingenieurs inhuren om al die verschillende formaten één voor één om te zetten naar jouw eigen systeem. Het was alsof je een restaurant zou openen waar je voor elke klant een andere taal moet spreken, in plaats van gewoon een menukaart te hebben die iedereen begrijpt. Hierdoor werden veel waardevolle data nooit gebruikt.

2. De Oplossing: ADP is de "Wereldtaal" voor Robots

De auteurs van dit paper hebben een nieuwe standaard bedacht, genaamd ADP (Agent Data Protocol).

De Metafoor: De Universele Adapter
Stel je voor dat je een wereldwijze reis maakt. Je hebt een telefoonlader, maar elk land heeft een ander stopcontact. Je zou voor elk land een nieuwe lader moeten kopen.
ADP is de universele adapter.

  • Alle verschillende data (de "stopcontacten") worden eerst aangesloten op deze adapter.
  • De adapter zet alles om naar één standaardstekker (het ADP-formaat).
  • Nu kan elke robot (jouw telefoon) die stekker direct gebruiken, ongeacht waar de data vandaan komt.

Met ADP hoeven onderzoekers niet meer voor elke dataset een nieuwe vertaler te bouwen. Ze zetten het een keer om naar ADP, en dan kan elke robot het gebruiken.

3. Wat zit er in deze "Adapter"?

ADP is heel slim ontworpen. Het ziet elke interactie van een robot als een gesprek van twee dingen:

  1. Acties: Wat doet de robot? (Bijvoorbeeld: "Ik klik op deze knop", "Ik schrijf deze code", "Ik bel deze telefoon").
  2. Observaties: Wat ziet de robot? (Bijvoorbeeld: "Het scherm toont nu een foutmelding", "De website is geladen", "De code is uitgevoerd").

Of het nu gaat om het oplossen van een bug in software, het kopen van een ticket op een website, of het zoeken naar informatie: ADP vertaalt alles naar deze simpele "Actie-Observatie" taal.

4. Het Resultaat: Een Super-Robot

De onderzoekers hebben 13 verschillende datasets (met in totaal 1,3 miljoen voorbeelden!) omgezet naar dit ene ADP-formaat. Vervolgens hebben ze een AI-model getraind met al deze data samen.

Wat gebeurde er?

  • De "Mix" werkt beter: Door de robot te laten leren van alles (coderen, zoeken, tools gebruiken) in plaats van alleen van één ding, werd hij veel slimmer. Het is alsof een student die alleen wiskunde doet, beter wordt in logisch denken als hij ook geschiedenis en muziek studeert.
  • Enorme verbetering: De robot werd gemiddeld 20% beter dan de modellen die er voorheen waren.
  • Geen specialisatie nodig: De robot deed het goed op coderen, webbladeren én het gebruik van tools, zonder dat ze hem voor elk vak apart moesten trainen. Hij werd een echte "generalist".

5. Waarom is dit belangrijk voor de toekomst?

Voorheen was het trainen van slimme robots een dure en moeilijke klus, alleen voor grote bedrijven met veel ingenieurs. Met ADP wordt het een stuk makkelijker:

  • Schaalbaar: Je kunt nu makkelijk nieuwe data toevoegen.
  • Open Source: De onderzoekers hebben alles gratis beschikbaar gesteld.
  • Snelheid: Het kost veel minder tijd om nieuwe robots te bouwen die kunnen leren van bestaande kennis.

Kortom:
Dit paper introduceert een soort "gemeenschappelijke taal" voor AI-robots. Hierdoor kunnen onderzoekers eindelijk alle stukjes puzzel die al bestaan samenvoegen tot één groot, krachtig plaatje. Het maakt het trainen van slimme, handige AI-assistenten niet alleen mogelijk, maar ook veel sneller, goedkoper en effectiever. Het is de eerste stap naar een wereld waar AI-assistenten echt alledaagse taken voor ons kunnen klaren.