DRBench: A Realistic Benchmark for Enterprise Deep Research
Il documento presenta DRBench, un nuovo benchmark realistico progettato per valutare le prestazioni degli agenti di intelligenza artificiale in compiti di ricerca approfondita complessi e aperti all'interno di contesti aziendali, integrando dati pubblici e privati attraverso un processo di sintesi verificato da umani.