FinRetrieval: A Benchmark for Financial Data Retrieval by AI Agents
Il paper introduce FinRetrieval, un benchmark di 500 domande per valutare la capacità degli agenti AI di recuperare dati numerici finanziari, rivelando che la disponibilità di strumenti strutturati è il fattore determinante per le prestazioni e che le modalità di ragionamento offrono benefici variabili in base alla capacità di base del modello.