FinRetrieval: A Benchmark for Financial Data Retrieval by AI Agents
O artigo apresenta o FinRetrieval, um novo benchmark com 500 perguntas de recuperação de dados financeiros que demonstra que a disponibilidade de ferramentas de API estruturada é o fator determinante para o desempenho dos agentes de IA, superando significativamente a busca na web e revelando variações de desempenho baseadas em configurações de raciocínio e convenções geográficas.