Risk-Adjusted Harm Scoring for Automated Red Teaming for LLMs in Financial Services

Dit paper introduceert een risicogebaseerd evaluatiekader voor de beveiliging van grote taalmodellen in de financiële sector, dat een gespecialiseerde taxonomie, geautomatiseerde red-teaming en een nieuwe 'Risk-Adjusted Harm Score' combineert om de operationele ernst van schadelijke uitkomsten beter te kwantificeren dan bestaande, domein-agnostische benchmarks.

Fabrizio Dimino, Bhaskarjit Sarmah, Stefano PasqualiThu, 12 Ma💰 q-fin

Convergence of Neural Network Policies for Risk--Reward Optimization

Deze paper introduceert een neural-network-framework voor multi-period risicorendement-optimatie met beperkte twee-staps feedback-beleid dat, onder zachte regulariteitsvoorwaarden, bewijst dat de empirische optimum convergeert naar de ware optimale waarde naarmate de netwerkcapaciteit en trainingsgrootte toenemen, wat wordt bevestigd door numerieke experimenten die uitval-robuustheid en nauwkeurige controle-heatmaps tonen.

Chang Chen, Duy-Minh DangMon, 09 Ma💰 q-fin