cs.CR Arbeiten | Gist.Science

Unclonable Encryption in the Haar Random Oracle Model

Dieses Paper stellt im Haar-Random-Oracle-Modell das erste klonunfähige Verschlüsselungsschema vor, das eine wiederverwendbare Sicherheit bietet und damit die Existenz solcher Systeme in einer Welt ohne Einwegfunktionen nachweist.

James Bartusek, Eli GoldinFri, 13 Ma⚛️ quant-ph

KEPo: Knowledge Evolution Poison on Graph-based Retrieval-Augmented Generation

Die Arbeit stellt KEPo vor, eine neuartige Vergiftungsmethode, die die Sicherheitsanfälligkeit von Graph-basiertem Retrieval-Augmented Generation (GraphRAG) ausnutzt, indem sie durch das Erzeugen toxischer Ereignisse und gefälschter Wissensentwicklungswege den Wissensgraphen manipuliert, um Large Language Models zu schädlichen Antworten zu verleiten.

Qizhi Chen, Chao Qi, Yihong Huang, Muquan Li, Rongzheng Wang, Dongyang Zhang, Ke Qin, Shuang LiangFri, 13 Ma🤖 cs.LG

Strict Optimality of Frequency Estimation Under Local Differential Privacy

Diese Arbeit beweist die strikte Optimalität eines Frequenzschätzers unter lokaler Differentialprivatsphäre, der durch eine symmetrische, extremale Konfiguration und eine optimierte Unterstützungsgröße gekennzeichnet ist, und stellt einen effizienten Algorithmus sowie eine modifizierte Count-Mean-Sketch-Methode vor, die theoretische Optimalität mit praktischer Anwendbarkeit vereinen.

Mingen PanFri, 13 Ma🔢 math

Taming OpenClaw: Security Analysis and Mitigation of Autonomous LLM Agent Threats

Diese Arbeit analysiert die Sicherheitsrisiken autonomer LLM-Agenten wie OpenClaw anhand eines fünfstufigen Lebenszyklus-Frameworks, identifiziert kritische Bedrohungen wie Prompt-Injection und Memory-Poisoning, und fordert ganzheitliche Sicherheitsarchitekturen, da bestehende punktuelle Abwehrmechanismen unzureichend sind.

Xinhao Deng, Yixiang Zhang, Jiaqing Wu, Jiaqi Bai, Sibo Yi, Zhuoheng Zou, Yue Xiao, Rennai Qiu, Jianan Ma, Jialuo Chen, Xiaohu Du, Xiaofang Yang, Shiwen Cui, Changhua Meng, Weiqiang Wang, Jiaxing Song, Ke Xu, Qi LiFri, 13 Ma🤖 cs.AI

Exponential-Family Membership Inference: From LiRA and RMIA to BaVarIA

Die Arbeit vereint die führenden Mitgliedschaftsinferenzangriffe LiRA, RMIA und BASE in einem gemeinsamen Exponentialfamilien-Rahmen, identifiziert die Varianzschätzung als Engpass und schlägt mit BaVarIA einen bayesschen Ansatz vor, der insbesondere bei begrenzten Ressourcen eine stabilere und leistungsfähigere Privatsphäre-Auditing ermöglicht.

Rickard BrännvallFri, 13 Ma🤖 cs.LG

You Told Me to Do It: Measuring Instructional Text-induced Private Data Leakage in LLM Agents

Die Studie identifiziert und quantifiziert das „Trusted Executor Dilemma", bei dem hochprivilegierte LLM-Agenten aufgrund ihrer strukturellen Anweisungsbefolgung schädliche, in Dokumentationen eingebettete Befehle nicht von legitimen Anweisungen unterscheiden können, was zu einer hohen Erfolgsrate bei Datenexfiltration und dem Versagen bestehender Abwehrmechanismen führt.

Ching-Yu Kao, Xinfeng Li, Shenyu Dai, Tianze Qiu, Pengcheng Zhou, Eric Hanchen Jiang, Philip SperlFri, 13 Ma🤖 cs.AI

The Mirror Design Pattern: Strict Data Geometry over Model Scale for Prompt Injection Detection

Die Arbeit stellt „Mirror" vor, ein Design-Pattern zur Organisation von Prompt-Injection-Daten in einer strengen geometrischen Topologie, das es einem extrem schnellen und deterministischen linearen SVM-Modell ermöglicht, als erste Verteidigungslinie eine höhere Erkennungsrate und geringere Latenz zu erreichen als deutlich größere neuronale Modelle.

J Alex CorllFri, 13 Ma🤖 cs.AI

On the Possible Detectability of Image-in-Image Steganography

Diese Arbeit zeigt, dass Bild-in-Bild-Steganografie aufgrund ihrer charakteristischen Mischprozesse, die sich mittels unabhängiger Komponentenanalyse und Momentenanalyse leicht identifizieren lassen, eine hohe Anfälligkeit für Entdeckung aufweist und mit vorgeschlagenen sowie klassischen Methoden eine sehr hohe Detektionsgenauigkeit erreicht wird.

Antoine Mallet (CRIStAL), Patrick Bas (CRIStAL)Fri, 13 Ma⚡ eess

Understanding LLM Behavior When Encountering User-Supplied Harmful Content in Harmless Tasks

Diese Studie zeigt, dass aktuelle Large Language Models auch bei harmlosen Aufgaben oft versagen, nutzerbereitete schädliche Inhalte zu erkennen und abzulehnen, wodurch ein bisher übersehener ethischer Risikobereich aufgedeckt wird.

Junjie Chu, Yiting Qu, Ye Leng, Michael Backes, Yun Shen, Savvas Zannettou, Yang ZhangFri, 13 Ma🤖 cs.AI

Delayed Backdoor Attacks: Exploring the Temporal Dimension as a New Attack Surface in Pre-Trained Models

Diese Arbeit stellt die Delayed Backdoor Attacks (DBA) vor, eine neue Angriffsklasse auf vortrainierte Modelle, die durch eine zeitlich verzögerte Aktivierung nach Trigger-Erkennung eine bisher ungenutzte Angriffsfläche eröffnet und dabei hohe Erfolgsraten bei gleichzeitiger Resistenz gegen bestehende Verteidigungsmechanismen demonstriert.

Zikang Ding, Haomiao Yang, Meng Hao, Wenbo Jiang, Kunlan Xiang, Runmeng Du, Yijing Liu, Ruichen Zhang, Dusit NiyatoFri, 13 Ma🤖 cs.AI

HomeSafe-Bench: Evaluating Vision-Language Models on Unsafe Action Detection for Embodied Agents in Household Scenarios

Die Arbeit stellt mit HomeSafe-Bench ein neues Benchmark-System und die HD-Guard-Architektur vor, um die Fähigkeit von Vision-Language-Modellen zur Echtzeit-Erkennung unsicherer Handlungen in häuslichen Umgebungen zu bewerten und zu verbessern.

Jiayue Pu, Zhongxiang Sun, Zilu Zhang, Xiao Zhang, Jun XuFri, 13 Ma🤖 cs.AI

Cascade: Composing Software-Hardware Attack Gadgets for Adversarial Threat Amplification in Compound AI Systems

Die Arbeit zeigt, wie traditionelle Software- und Hardware-Schwachstellen in komplexen KI-Systemen mit algorithmischen Angriffen kombiniert werden können, um die Integrität und Vertraulichkeit von KI-Pipelines zu gefährden, und schlägt eine systematisierte Methodik zur Abwehr solcher zusammengesetzten Bedrohungen vor.

Sarbartha Banerjee, Prateek Sahu, Anjo Vahldiek-Oberwagner, Jose Sanchez Vicarte, Mohit TiwariFri, 13 Ma🤖 cs.AI

Understanding Disclosure Risk in Differential Privacy with Applications to Noise Calibration and Auditing (Extended Version)

Diese Arbeit stellt mit dem „Reconstruction Advantage" ein einheitliches Risikomaß vor, das die irreführenden Grenzen bestehender Ansätze überwindet und eine präzisere Rauschkalibrierung sowie systematische Audits für Differential Privacy ermöglicht.

Patricia Guerra-Balboa, Annika Sauer, Héber H. Arcolezi, Thorsten StrufeFri, 13 Ma🔢 math

Security Considerations for Artificial Intelligence Agents

Dieser Artikel fasst Perplexitys Erfahrungen mit der Sicherheit von KI-Agenten zusammen, identifiziert neue Angriffsvektoren wie indirekte Prompt-Injection und verwirrte Stellvertreter, bewertet mehrschichtige Verteidigungsstrategien und formuliert Empfehlungen für zukünftige Sicherheitsstandards im Einklang mit NIST-Richtlinien.

Ninghui Li, Kaiyuan Zhang, Kyle Polley, Jerry MaFri, 13 Ma🤖 cs.LG

STAMP: Selective Task-Aware Mechanism for Text Privacy

Das Papier stellt STAMP vor, ein Framework für die textbasierte Privatsphäre, das durch eine token-spezifische Zuweisung von Privatsphärenbudgets und einen polarisierten Mechanismus zur Störung von Embeddings eine überlegene Balance zwischen Datenschutz und Nutzen für nachgelagerte Aufgaben erreicht.

Fengwei Tian, Payel Bhattacharjee, Heidi Hanson, Geoffrey D. Rubin, Joseph Y. Lo, Ravi TandonFri, 13 Ma🤖 cs.LG

Detecting LLM-Generated Peer Reviews

Diese Arbeit stellt ein robustes statistisches Rahmenwerk vor, das durch indirekte Prompt-Injection über PDFs und eine wasserzeichenbasierte Detektion LLM-generierte Peer-Reviews zuverlässig identifiziert, während sie gleichzeitig die Fehlerquote über mehrere Bewertungen hinweg kontrolliert und dabei die Grenzen herkömmlicher Korrekturverfahren wie Bonferroni überwindet.

Vishisht Rao, Aounon Kumar, Himabindu Lakkaraju + 1 more2026-03-13🤖 cs.AI

Integer Factorization via Tensor Network Schnorr's Sieving

Diese Arbeit stellt einen Tensor-Netzwerk-basierten Algorithmus vor, der Schnorr's Siebung nutzt, um RSA-Zahlen bis zu 100 Bit zu faktorisieren und dabei numerische Hinweise auf eine polynomielle Skalierung der Ressourcen liefert, was die Dringlichkeit postquantenkryptografischer Sicherheitsmaßnahmen unterstreicht.

Marco Tesoro, Ilaria Siloi, Daniel Jaschke + 2 more2026-03-12⚛️ quant-ph

PrometheusFree: Concurrent Detection of Laser Fault Injection Attacks in Optical Neural Networks

Die Arbeit stellt PrometheusFree vor, ein Framework für optische neuronale Netze, das durch die Anwendung der Wellenlängen-Dispersions-Störung (WDP) Laser-Fehlerinjektionsangriffe auf Silizium-Photonik-AI-Beschleuniger mit über 96 % Erkennungsgenauigkeit gleichzeitig detektieren und deren Erfolgsrate um durchschnittlich 38,6 % senken kann.

Kota Nishida, Yoshihiro Midoh, Noriyuki Miura + 3 more2026-03-12🔬 physics.optics

Probabilistic Counters for Privacy Preserving Data Aggregation

Diese Arbeit untersucht probabilistische Zähler unter dem Aspekt des Datenschutzes und zeigt, dass deren inhärente Randomisierung ausreicht, um Differential Privacy zu gewährleisten, wodurch sie als effiziente Alternative zu herkömmlichen Methoden wie dem Laplace-Mechanismus für verteilte Datenerhebungen dienen können.

Dominik Bojko, Krzysztof Grining, Marek Klonowski2026-03-11💻 cs

Automated TEE Adaptation with LLMs: Identifying, Transforming, and Porting Sensitive Functions in Programs

Die Arbeit stellt AUTOTEE vor, einen auf Large Language Models basierenden Ansatz, der automatisch sensible Funktionen in Programmen identifiziert, transformiert und in Trusted Execution Environments (TEEs) portiert, wodurch die bisher manuelle und komplexe Anpassung erheblich vereinfacht wird.

Ruidong Han, Zhou Yang, Chengyan Ma, Ye Liu, Yuqing Niu, Siqi Ma, Debin Gao, David Lo2026-03-06🔒 cs.CR

← Zurück Weiter →