Anticipating Safety Issues in E2E Conversational AI: Framework and Tooling
Dieser Artikel stellt einen Rahmenwerk und ein Toolset vor, das auf wertebasiertem Design basiert, um Forschern zu helfen, Sicherheitsrisiken end-zu-end neuronaler Konversationsagenten zu antizipieren und fundierte Entscheidungen über deren Training und Veröffentlichung zu treffen.