FinToolBench: Evaluating LLM Agents for Real-World Financial Tool Use
Il paper introduce FinToolBench, il primo benchmark eseguibile al mondo per valutare agenti LLM nell'uso di strumenti finanziari reali, colmando il divario tra le attuali valutazioni statiche e le esigenze dinamiche, ad alto rischio e conformi alle normative del settore finanziario.