DRBench: A Realistic Benchmark for Enterprise Deep Research
Este trabalho apresenta o DRBench, um novo benchmark realista composto por 100 tarefas de pesquisa profunda em 10 domínios empresariais, projetado para avaliar a capacidade de agentes de IA de integrar informações da web pública e bases de conhecimento privadas para gerar relatórios precisos e estruturados.