Real-Time Trust Verification for Safe Agentic Actions using TrustBench
Die Arbeit stellt TrustBench vor, ein Echtzeit-Framework, das durch eine präventive Verifikation von Agentenaktionen vor deren Ausführung und den Einsatz domänenspezifischer Plugins die Anzahl schädlicher Aktionen um 87 % reduziert und damit den Übergang von Large Language Models zu vertrauenswürdigen autonomen Agenten ermöglicht.