EigenData: A Self-Evolving Multi-Agent Platform for Function-Calling Data Synthesis, Auditing, and Repair
Dit paper introduceert EigenData, een zelfevoluerend multi-agentplatform dat de volledige levenscyclus van function-calling data automatiseert en gebruikt om de Berkeley Function-Calling Leaderboard te auditeren en te repareren, wat resulteert in een betrouwbaardere evaluatie die beter correleert met menselijke oordelen over functionele correctheid.