Measuring Privacy vs. Fidelity in Synthetic Social Media Datasets
Cette étude propose un cadre méthodologique pour évaluer le compromis entre la confidentialité et la fidélité des publications Instagram synthétiques générées par des modèles de langage, en démontrant que la réidentification des auteurs est moins efficace sur les données synthétiques mais que la fidélité accrue entraîne une fuite de confidentialité plus importante.