DRBench: A Realistic Benchmark for Enterprise Deep Research
Die Arbeit stellt DRBench vor, ein realistisches Benchmark für die Bewertung von KI-Agenten bei komplexen, mehrstufigen Forschungsfragen in Unternehmensumgebungen, die sowohl öffentliche Webquellen als auch interne Wissensdatenbanken einbeziehen.