FinSheet-Bench: From Simple Lookups to Complex Reasoning, Where LLMs Break on Financial Spreadsheets
Die Studie „FinSheet-Bench" stellt ein synthetisches Benchmark für Finanztabellen vor und zeigt, dass aktuelle Large Language Models bei komplexen, strukturierten Finanzdaten noch zu viele Fehler machen, um in professionellen Anwendungen ohne menschliche Überprüfung eingesetzt zu werden.