EigenData: A Self-Evolving Multi-Agent Platform for Function-Calling Data Synthesis, Auditing, and Repair
Die Arbeit stellt EigenData vor, eine selbstentwickelnde Multi-Agenten-Plattform, die den gesamten Lebenszyklus von Daten für Funktionsaufrufe automatisiert und durch die Korrektur des BFCL-V3-Tests sowie die Einführung einer ergebnisorientierten Evaluierung die Übereinstimmung zwischen Modellrankings und menschlichen Bewertungen der funktionalen Korrektheit signifikant verbessert.