Jailbreak Foundry: From Papers to Runnable Attacks for Reproducible Benchmarking
Das Paper stellt JAILBREAK FOUNDRY (JBF) vor, ein Multi-Agenten-System, das Sicherheitslücken-Forschungspapiere automatisch in ausführbare Module übersetzt, um durch eine standardisierte Infrastruktur reproduzierbare und vergleichbare Benchmarks für die Robustheit von Large Language Models zu ermöglichen.