Extracting Training Dialogue Data from Large Language Model based Task Bots
Diese Arbeit untersucht die Privatsphärenrisiken von LLM-basierten Task-Bots, indem sie zeigt, dass diese Trainingsdaten memorieren können, und entwickelt neue Angriffstechniken, um tausende Dialogzustände mit hoher Präzision zu extrahieren, woraus sich gezielte Minderungsstrategien ableiten lassen.