DRBench: A Realistic Benchmark for Enterprise Deep Research
Ce papier présente DRBench, un nouveau benchmark réaliste conçu pour évaluer les agents d'IA sur des tâches de recherche approfondie en entreprise, en les confrontant à des requêtes complexes nécessitant l'intégration de données provenant à la fois du web public et de bases de connaissances privées.