Measuring Privacy vs. Fidelity in Synthetic Social Media Datasets
Diese Studie entwickelt einen Rahmen zur Bewertung des Spannungsverhältnisses zwischen Datenschutz und Datenqualität bei synthetischen Social-Media-Daten, indem sie zeigt, dass zwar das Risiko einer Autorenidentifizierung durch KI-generierte Instagram-Posts im Vergleich zu realen Daten sinkt, jedoch ein höherer Grad an Datenqualität zwangsläufig mit einem erhöhten Privatsphärenrisiko einhergeht.