Measuring Privacy vs. Fidelity in Synthetic Social Media Datasets
Questo studio valuta il compromesso tra privacy e fedeltà nei dataset sintetici di social media, dimostrando che, sebbene i post sintetici generati da modelli linguistici riducano il rischio di re-identificazione rispetto ai dati reali, esiste una tensione intrinseca tra un'elevata fedeltà e una maggiore esposizione alla fuga di informazioni private.