A Decade of News Forum Interactions: Threaded Conversations, Signed Votes, and Topical Tags

Deze paper introduceert een groot, langlopend dataset van meer dan 75 miljoen reacties en 400 miljoen stemmen uit de discussiefora van de Oostenrijkse krant DerStandard (2013-2022), waarbij gebruikersprivacy wordt gewaarborgd door geanonimiseerde ID's en het vrijgeven van vooraf berekende vectorrepresentaties in plaats van de ruwe tekst.

Emma Fraxanet, Vicenç Gómez, Andreas Kaltenbrunner, Max PellertWed, 11 Ma💻 cs

Does Scientific Writing Converge to U.S. English? Evidence from Generative AI-Assisted Publications

Een analyse van 5,65 miljoen wetenschappelijke artikelen toont aan dat generatieve AI-assistentie leidt tot een toenemende convergentie van de schrijfstijl van auteurs uit niet-Engelstalige landen naar het dominante Amerikaanse wetenschappelijke Engels, waardoor historische taalbarrières worden verlaagd maar de vraag naar een verdere afhankelijkheid van één taalkundige standaard blijft bestaan.

Dragan Filimonovic, Christian Rutzer, Jeffrey Macher, Rolf WederWed, 11 Ma💬 cs.CL

Queer NLP: A Critical Survey on Literature Gaps, Biases and Trends

Dit artikel biedt een kritisch overzicht van het onderzoek naar queer NLP, waarbij het vaststelt dat de huidige literatuur vooral reageert op bestaande vooroordelen in plaats van proactief nieuwe oplossingen te bieden, en pleit voor meer inclusieve, interdisciplinaire en intersectionele toekomstige studies.

Sabine Weber, Angelina Wang, Ankush Gupta, Arjun Subramonian, Dennis Ulmer, Eshaan Tanwar, Geetanjali Aich, Hannah Devinney, Jacob Hobbs, Jennifer Mickel, Joshua Tint, Mae Sosto, Ray Groshan, Simone Astarita, Vagrant Gautam, Verena Blaschke, William Agnew, Wilson Y Lee, Yanan LongWed, 11 Ma💻 cs

From Verification to Amplification: Auditing Reverse Image Search as Algorithmic Gatekeeping in Visual Misinformation Fact-checking

Deze studie toont aan dat Google's reverse image search als algoritmische poortwachter bij het fact-checken van visuele desinformatie vaak faalt doordat ontmaskerende content minder dan 30% van de resultaten uitmaakt en wordt overschaduwd door irrelevante informatie en herhaalde nepbeelden.

Cong Lin, Yifei Chen, Jiangyue Chen, Yingdan Lu, Yilang Peng, Cuihua ShenWed, 11 Ma💻 cs

PixelConfig: Longitudinal Measurement and Reverse-Engineering of Meta Pixel Configurations

Dit paper introduceert PixelConfig, een framework voor het reverse-engineeren van Meta Pixel-configuraties, en onthult dat gezondheidswebsites tot 98,4% gebruikmaken van ingebouwde functies voor activiteits- en identiteitsvolging, waarbij zelfs gevoelige medische informatie wordt getrackt ondanks beperkte en vaak te omzeilen privacybeperkingen.

Abdullah Ghani (Lahore University of Management Sciences), Yash Vekaria (University of California, Davis), Zubair Shafiq (University of California, Davis)Wed, 11 Ma💻 cs