Replayable Financial Agents: A Determinism-Faithfulness Assurance Harness for Tool-Using LLM Agents
Il paper introduce il Determinism-Faithfulness Assurance Harness (DFAH), un framework open-source per valutare l'indipendenza tra determinismo e accuratezza negli agenti LLM finanziari, dimostrando che nessun modello attuale garantisce simultaneamente entrambe le proprietà e fornendo benchmark specifici per soddisfare i requisiti di audit regolamentare.