EigenData: A Self-Evolving Multi-Agent Platform for Function-Calling Data Synthesis, Auditing, and Repair
Il paper presenta EigenData, una piattaforma multi-agente auto-evolutiva che automatizza la sintesi, l'audit e la riparazione dei dati per il function calling, migliorando significativamente la correlazione tra le valutazioni dei modelli e il giudizio umano sulla correttezza funzionale attraverso la correzione del benchmark BFCL-V3 e l'introduzione di metriche basate sullo stato del database.