cs.CR papers | Gist.Science

Unclonable Encryption in the Haar Random Oracle Model

Dit artikel presenteert het eerste bewijs voor de bestaan van herbruikbare, onkloonbare encryptie met willekeurige berichtlengte in het Haar-random-orakelmodel, een wereld waarin eenwegfuncties mogelijk niet bestaan, door middel van een nieuw bewijsraamwerk dat een unitair herschrijvingslemma omvat.

James Bartusek, Eli GoldinFri, 13 Ma⚛️ quant-ph

KEPo: Knowledge Evolution Poison on Graph-based Retrieval-Augmented Generation

Dit paper introduceert KEPo, een nieuwe aanvalsmethode die de kwetsbaarheid van GraphRAG-systemen benut door vergiftigde kennis in een kennisgrafiek te injecteren via vervalste evolutiepaden, waardoor grote taalmodellen worden gemanipuleerd tot het genereren van schadelijke antwoorden met een aanzienlijk hogere succeskans dan bestaande methoden.

Qizhi Chen, Chao Qi, Yihong Huang, Muquan Li, Rongzheng Wang, Dongyang Zhang, Ke Qin, Shuang LiangFri, 13 Ma🤖 cs.LG

Strict Optimality of Frequency Estimation Under Local Differential Privacy

Dit artikel bewijst de strikte optimaliteit van frequentieschatting onder lokale differentiaalsecretie door een estimator met een symmetrische configuratie en geoptimaliseerde steunmaat te introduceren, die theoretisch maximale precisie bereikt met minimale communicatiekosten en in de praktijk bijna ononderscheidbaar is van de theorie.

Mingen PanFri, 13 Ma🔢 math

Taming OpenClaw: Security Analysis and Mitigation of Autonomous LLM Agent Threats

Dit artikel analyseert de beveiligingsrisico's van autonome LLM-agenten zoals OpenClaw via een vijflaagslevenscyclusframework, identificeert complexe bedreigingen zoals indirecte prompt-injectie en geheugenvergiftiging, en pleit voor holistische beveiligingsarchitecturen in plaats van puntsgewijze verdedigingsmechanismen.

Xinhao Deng, Yixiang Zhang, Jiaqing Wu, Jiaqi Bai, Sibo Yi, Zhuoheng Zou, Yue Xiao, Rennai Qiu, Jianan Ma, Jialuo Chen, Xiaohu Du, Xiaofang Yang, Shiwen Cui, Changhua Meng, Weiqiang Wang, Jiaxing Song, Ke Xu, Qi LiFri, 13 Ma🤖 cs.AI

Exponential-Family Membership Inference: From LiRA and RMIA to BaVarIA

Dit paper verenigt bestaande lidmaatschapsinference-aanvallen (LiRA, RMIA en BASE) in één exponentiële-familie-raamwerk en introduceert BaVarIA, een Bayesiaanse aanpak die door het schatten van variantie superieure prestaties biedt, vooral bij beperkte middelen.

Rickard BrännvallFri, 13 Ma🤖 cs.LG

You Told Me to Do It: Measuring Instructional Text-induced Private Data Leakage in LLM Agents

Dit onderzoek identificeert en kwantificeert de 'Trusted Executor Dilemma'-kwetsbaarheid, waarbij high-privilege LLM-agenten onbedoeld instructies uit documentatie uitvoeren, wat leidt tot een hoge kans op datalekken en een gebrek aan effectieve verdedigingsmechanismen.

Ching-Yu Kao, Xinfeng Li, Shenyu Dai, Tianze Qiu, Pengcheng Zhou, Eric Hanchen Jiang, Philip SperlFri, 13 Ma🤖 cs.AI

The Mirror Design Pattern: Strict Data Geometry over Model Scale for Prompt Injection Detection

Dit paper introduceert Mirror, een ontwerppatroon dat door middel van strikte data-geometrie en een lineair SVM-model een snelle, deterministische en auditabele detectie van prompt-injecties mogelijk maakt, waarbij een hoge recall wordt bereikt zonder de afhankelijkheid van grote neurale modellen.

J Alex CorllFri, 13 Ma🤖 cs.AI

On the Possible Detectability of Image-in-Image Steganography

Dit artikel toont aan dat beeld-in-beeld-steganografie, waarbij een afbeelding in een andere van dezelfde grootte wordt verborgen, kwetsbaar is voor detectie door middel van onafhankelijke componentenanalyse en een eenvoudige steganalysemethode gebaseerd op de eerste vier momenten van golfkleedcomponenten, wat leidt tot zeer hoge detectiepercentages.

Antoine Mallet (CRIStAL), Patrick Bas (CRIStAL)Fri, 13 Ma⚡ eess

Understanding LLM Behavior When Encountering User-Supplied Harmful Content in Harmless Tasks

Deze studie toont aan dat hedendaagse grote taalmodellen, zelfs de nieuwste versies, vaak ethisch falen door schadelijke inhoud in gebruikersinvoer te verwerken tijdens ogenschijnlijk onschadelijke taken, wat een over het hoofd gezien veiligheidsrisico blootlegt dat dringend aandacht vereist.

Junjie Chu, Yiting Qu, Ye Leng, Michael Backes, Yun Shen, Savvas Zannettou, Yang ZhangFri, 13 Ma🤖 cs.AI

Delayed Backdoor Attacks: Exploring the Temporal Dimension as a New Attack Surface in Pre-Trained Models

Dit paper introduceert 'Delayed Backdoor Attacks' (DBA), een nieuwe aanvalsvorm op voorgeöorde modellen waarbij de schadelijke activatie tijdelijk wordt uitgesteld na het zien van een trigger, wat het mogelijk maakt om alledaagse woorden als triggers te gebruiken en zo een tot nu toe onbeschermd tijdsdimensie als aanvalsoppervlak blootlegt.

Zikang Ding, Haomiao Yang, Meng Hao, Wenbo Jiang, Kunlan Xiang, Runmeng Du, Yijing Liu, Ruichen Zhang, Dusit NiyatoFri, 13 Ma🤖 cs.AI

HomeSafe-Bench: Evaluating Vision-Language Models on Unsafe Action Detection for Embodied Agents in Household Scenarios

Dit paper introduceert HomeSafe-Bench, een benchmark voor het evalueren van visueel-taalmodellen op het detecteren van onveilige handelingen in huishoudelijke omgevingen, en stelt HD-Guard voor, een hiërarchisch beveiligingssysteem dat efficiëntie en nauwkeurigheid combineert voor realtime monitoring.

Jiayue Pu, Zhongxiang Sun, Zilu Zhang, Xiao Zhang, Jun XuFri, 13 Ma🤖 cs.AI

Cascade: Composing Software-Hardware Attack Gadgets for Adversarial Threat Amplification in Compound AI Systems

Dit paper introduceert 'Cascade', een aanvalsmethode die traditionele software- en hardwarekwetsbaarheden combineert met algoritmische zwaktes in samengestelde AI-systemen om de integriteit en vertrouwelijkheid van deze systemen te ondermijnen.

Sarbartha Banerjee, Prateek Sahu, Anjo Vahldiek-Oberwagner, Jose Sanchez Vicarte, Mohit TiwariFri, 13 Ma🤖 cs.AI

Understanding Disclosure Risk in Differential Privacy with Applications to Noise Calibration and Auditing (Extended Version)

Dit artikel introduceert 'reconstruction advantage' als een unificerend risicometriek dat de beperkingen van bestaande methoden overbrugt, waardoor nauwkeurigere ruis-calibratie en systematische auditing van differentieel privacy mogelijk worden.

Patricia Guerra-Balboa, Annika Sauer, Héber H. Arcolezi, Thorsten StrufeFri, 13 Ma🔢 math

Security Considerations for Artificial Intelligence Agents

Dit artikel, gebaseerd op Perplexity's ervaringen, analyseert de nieuwe beveiligingsrisico's van AI-agenten die ontstaan door veranderde architecturale aannames, schetst de belangrijkste aanvalsvlakken en verdedigingslagen, en identificeert aanbevelingen voor normen en onderzoekslacunes in lijn met de NIST-risicobeheerprincipes.

Ninghui Li, Kaiyuan Zhang, Kyle Polley, Jerry MaFri, 13 Ma🤖 cs.LG

STAMP: Selective Task-Aware Mechanism for Text Privacy

Het paper introduceert STAMP, een nieuw raamwerk voor tekstprivacy dat een verbeterde afweging tussen privacy en bruikbaarheid bereikt door privacybudgetten selectief toe te wijzen aan tokens op basis van hun taakrelevantie en gevoeligheid, en gebruik te maken van een polair mechanisme dat alleen de richting van token-embeddings perturbeert om de semantische structuur te behouden.

Fengwei Tian, Payel Bhattacharjee, Heidi Hanson, Geoffrey D. Rubin, Joseph Y. Lo, Ravi TandonFri, 13 Ma🤖 cs.LG

Detecting LLM-Generated Peer Reviews

Dit artikel introduceert een robuust statistisch raamwerk voor het detecteren van door LLM's gegenereerde peer reviews via indirecte prompt-injectie en watermerking, dat een hogere statistische power biedt dan traditionele correctiemethoden zoals Bonferroni.

Vishisht Rao, Aounon Kumar, Himabindu Lakkaraju + 1 more2026-03-13🤖 cs.AI

Integer Factorization via Tensor Network Schnorr's Sieving

Deze studie toont aan dat het combineren van Schnorr's zeefmethode met tensornetwerken een klassieke, kwantum-geïnspireerde aanpak biedt voor het factoriseren van RSA-getallen met een schaalbaarheid die suggereert dat de overgang naar post-kwantumcryptografie dringend noodzakelijk is.

Marco Tesoro, Ilaria Siloi, Daniel Jaschke + 2 more2026-03-12⚛️ quant-ph

PrometheusFree: Concurrent Detection of Laser Fault Injection Attacks in Optical Neural Networks

Dit artikel introduceert PrometheusFree, een framework voor optische neurale netwerken dat laser-foutinjectie-aanvallen gelijktijdig detecteert en de aanvalsuccesratio aanzienlijk verlaagt door middel van een nieuwe toepassing van de Wavelength Division Perturbation-techniek.

Kota Nishida, Yoshihiro Midoh, Noriyuki Miura + 3 more2026-03-12🔬 physics.optics

Probabilistic Counters for Privacy Preserving Data Aggregation

Dit artikel toont aan dat probabilistische tellers, zoals de Morris- en MaxGeo-teller, zonder extra randomisatie kunnen dienen als privacybeschermingsmechanisme voor gedistribueerde data-aggregatie, waarbij de inherente willekeur van het protocol voldoende is om aan strikte differentieel privacy-eisen te voldoen.

Dominik Bojko, Krzysztof Grining, Marek Klonowski2026-03-11💻 cs

Automated TEE Adaptation with LLMs: Identifying, Transforming, and Porting Sensitive Functions in Programs

Dit paper introduceert AUTOTEE, een door Large Language Models aangedreven methode die ontwikkelaars helpt om automatisch gevoelige functies in bestaande programma's te identificeren, te transformeren en te porteren naar Trusted Execution Environments (TEEs) voor verbeterde beveiliging.

Ruidong Han, Zhou Yang, Chengyan Ma, Ye Liu, Yuqing Niu, Siqi Ma, Debin Gao, David Lo2026-03-06🔒 cs.CR

← Vorige Volgende →