Robustness Over Time: Understanding Adversarial Examples' Effectiveness on Longitudinal Versions of Large Language Models

Dit onderzoek toont aan dat updates van grote taalmodellen niet consequent leiden tot verbeterde weerbaarheid tegen adversariële aanvallen, aangezien nieuwe versies soms juist slechter presteren op gebieden zoals misclassificatie en hallucinaties ondanks verbeterde beveiliging tegen jailbreaks.

Yugeng Liu, Tianshuo Cong, Zhengyu Zhao, Michael Backes, Yun Shen, Yang ZhangWed, 11 Ma💻 cs

VisPoison: An Effective Backdoor Attack Framework for Tabular Data Visualization Models

Dit paper introduceert VisPoison, een effectief backdoor-aanvalskader dat via datavergiftiging kwetsbaarheden blootlegt in tekst-naar-visualisatiemodellen voor tabulaire data, waardoor deze gevoelige informatie kunnen lekken, misleidende visualisaties genereren of geweigerde diensten veroorzaken.

Shuaimin Li, Chen Jason Zhang, Xuanang Chen, Anni Peng, Zhuoyue Wan, Yuanfeng Song, Shiwen Ni, Min Yang, Fei Hao, Raymond Chi-Wing WongWed, 11 Ma💻 cs

DeZent: Decentralized z-Anonymity with Privacy-Preserving Coordination

Dit paper introduceert deZent, een gedecentraliseerde implementatie van z-anonimiteit die privacy in sensornetwerken verbetert door lokale anonimiseringsprocessen te coördineren met behulp van een stochastische telstructuur en een beveiligde som, waardoor de afhankelijkheid van een centraal entiteit wordt verminderd en de communicatie-overhead wordt verlaagd zonder in te leveren op de prestaties.

Carolin Brunn, Florian TschorschWed, 11 Ma💻 cs

NetDiffuser: Deceiving DNN-Based Network Attack Detection Systems with Diffusion-Generated Adversarial Traffic

Dit artikel introduceert NetDiffuser, een nieuw raamwerk dat diffusiemodellen en een innovatief feature-categorisatiealgoritme combineert om natuurlijke adversariële voorbeelden te genereren die DNN-gebaseerde netwerkintrusiedetectiesystemen effectief misleiden met een aanzienlijk hogere aanvalsuccesratio dan bestaande methoden.

Pratyay Kumar, Abu Saleh Md Tayeen, Satyajayant Misra, Huiping Cao, Jiefei Liu, Qixu Gong, Jayashree HarikumarWed, 11 Ma🤖 cs.AI