Measuring Privacy vs. Fidelity in Synthetic Social Media Datasets
Dit onderzoek evalueert de privacy en kwaliteit van synthetische Instagram-berichten gegenereerd door grote taalmodellen, waarbij wordt vastgesteld dat hoewel het re-identificatierisico lager is dan bij echte data, er een duidelijke afweging bestaat tussen hoge datafideliteit en verhoogde privacylekken.