FinToolBench: Evaluating LLM Agents for Real-World Financial Tool Use
Das Paper stellt FinToolBench vor, das erste ausführbare Benchmark-System mit 760 realen Finanzwerkzeugen und einem spezialisierten Evaluierungsrahmen, um die Leistung von LLM-Agenten in komplexen, regulatorisch anspruchsvollen Finanzszenarien zu bewerten.