cs.CR Arbeiten | Gist.Science

AttriGuard: Defeating Indirect Prompt Injection in LLM Agents via Causal Attribution of Tool Invocations

Die Arbeit stellt AttriGuard vor, eine Laufzeit-Verteidigung für LLM-Agenten, die durch kausale Attribution und kontrafaktische Tests indirekte Prompt-Injection-Angriffe effektiv abwehrt, indem sie Tool-Aufrufe auf ihre Notwendigkeit basierend auf der Benutzerabsicht überprüft.

Yu He, Haozhe Zhu, Yiming Li, Shuo Shao, Hongwei Yao, Zhihao Liu, Zhan QinThu, 12 Ma💻 cs

A PUF-Based Approach for Copy Protection of Intellectual Property in Neural Network Models

Die vorgestellte Arbeit nutzt Physikalisch Unclonbare Funktionen (PUFs), um die Gewichte von neuronalen Netzwerkmodellen an die eindeutigen Hardware-Eigenschaften zu binden, wodurch eine korrekte Ausführung auf geklonten Geräten verhindert und der Schutz des geistigen Eigentums sichergestellt wird.

Daniel Dorfmeister, Flavio Ferrarotti, Bernhard Fischer, Martin Schwandtner, Hannes SochorThu, 12 Ma🤖 cs.LG

Incremental Federated Learning for Intrusion Detection in IoT Networks under Evolving Threat Landscape

Diese Studie analysiert die Leistungsfähigkeit inkrementeller Federated-Learning-Ansätze mit LSTM-Modellen auf dem CICIoMT2024-Datensatz, um ressourcenschonende und drift-resistente Intrusion-Detection-Systeme für IoT-Netzwerke zu entwickeln, wobei sich zeigt, dass kumulative und repräsentative Lernstrategien die stabilste Leistung bieten.

Muaan Ur Rehman, Hayretdin Bahs, Rajesh KalakotiThu, 12 Ma💻 cs

Re-Evaluating EVMBench: Are AI Agents Ready for Smart Contract Security?

Diese Studie widerlegt die Annahme, dass KI-Agenten die menschliche Prüfung von Smart Contracts vollständig ersetzen können, indem sie aufzeigen, dass die ursprünglichen EVMbench-Ergebnisse durch Datenkontamination und mangelnde Robustheit verzerrt waren und reale Sicherheitsvorfälle eine menschliche Expertise erfordern.

Chaoyuan Peng, Lei Wu, Yajin ZhouThu, 12 Ma💻 cs

Backdoor Directions in Vision Transformers

Diese Arbeit untersucht die Repräsentation von Backdoor-Angriffen in Vision Transformern, identifiziert eine kausale „Trigger-Richtung" in den Aktivierungen, die zur Diagnose und zum Verständnis der Verarbeitungslogik verschiedener Trigger-Typen sowie zur Entwicklung eines gewichtsbasierten, datenfreien Detektionsverfahrens genutzt wird.

Sengim Karayalcin, Marina Krcek, Pin-Yu Chen, Stjepan PicekThu, 12 Ma💻 cs

MAD: Memory Allocation meets Software Diversity

Das Paper stellt MAD vor, einen hardware- und softwareunabhängigen Ansatz, der durch die Kombination von Speicherallokation mit Software-Diversität und zwei neuartigen räumlichen Diversifizierungstechniken RowHammer-Angriffe verzögert, um Zeit für weitere Gegenmaßnahmen zu gewinnen.

Manuel Wiesinger, Daniel Dorfmeister, Stefan BrunthalerThu, 12 Ma💻 cs

TOSSS: a CVE-based Software Security Benchmark for Large Language Models

Das Paper stellt TOSSS vor, ein auf CVE-Daten basierendes Benchmark-System zur Bewertung der Fähigkeit von Large Language Models, sichere von anfälligen Code-Snippets in C/C++ und Java zu unterscheiden, wobei die getesteten Modelle Sicherheitswerte zwischen 0,48 und 0,89 erreichten.

Marc Damie, Murat Bilgehan Ertan, Domenico Essoussi, Angela Makhanu, Gaëtan Peter, Roos WensveenThu, 12 Ma🤖 cs.LG

Layered Performance Analysis of TLS 1.3 Handshakes: Classical, Hybrid, and Pure Post-Quantum Key Exchange

Diese Studie analysiert im Laborumfeld die Auswirkungen von klassischen, hybriden und reinen postquantenkryptografischen Schlüsselaustauschverfahren auf die verschiedenen Ebenen von TLS 1.3-Handshakes und HTTP-Transaktionen unter Last.

David Gómez-Cambronero, Daniel Munteanu, Ana Isabel González-TablasThu, 12 Ma💻 cs

Separating Oblivious and Adaptive Differential Privacy under Continual Observation

Diese Arbeit löst eine offene Frage von Jain et al., indem sie erstmals ein Problem vorstellt, das die Differential-Privacy unter kontinuierlicher Beobachtung in den oblivious und adaptiven Settings trennt, indem sie zeigt, dass ein oblivious Algorithmus über exponentiell viele Zeitschritte hinweg genau bleibt, während jeder adaptive Algorithmus bereits nach konstant vielen Schritten ungenau wird.

Mark Bun, Marco Gaboardi, Connor WagamanThu, 12 Ma💻 cs

Adversarial Robustness of Partitioned Quantum Classifiers

Diese Arbeit untersucht die adversarische Robustheit partitionierter Quantenklassifizierer, indem sie einen Zusammenhang zwischen Störungen durch Wire-Cutting oder Teleportation und der Implementierung adversarischer Gatter in Zwischenschichten herstellt und dieses Problem sowohl theoretisch als auch experimentell analysiert.

Pouya Kananian, Hans-Arno JacobsenMon, 09 Ma⚛️ quant-ph

HVAC-EAR: Eavesdropping Human Speech Using HVAC Systems

Die Studie HVAC-EAR demonstriert erstmals, dass menschliche Sprache über die akustischen Druckdaten von HVAC-Systemen auch bei niedrigen Abtastraten und über Entfernungen von bis zu 1,2 Metern rekonstruiert werden kann, was neue Datenschutzbedenken aufwirft.

Tarikul Islam Tamiti, Biraj Joshi, Rida Hasan, Anomadarshi BaruaMon, 09 Ma💻 cs

SPARK: Jailbreaking T2V Models by Synergistically Prompting Auditory and Recontextualized Knowledge

Die Studie stellt SPARK vor, einen Jailbreak-Angriffsrahmen, der Text-zu-Video-Modelle durch die synergistische Kombination neutraler Szenenanker, latenter auditiver Trigger und stilistischer Modulatoren in benignen Prompts manipuliert, um sicherheitsrelevante Richtlinien zu umgehen und semantisch unsichere Videos zu generieren.

Zonghao Ying, Moyang Chen, Nizhang Li, Zhiqiang Wang, Wenxin Zhang, Quanchen Zou, Zonglei Jing, Aishan Liu, Xianglong LiuMon, 09 Ma💻 cs

Agent Tools Orchestration Leaks More: Dataset, Benchmark, and Mitigation

Diese Arbeit identifiziert und analysiert das neuartige Risiko der „Tools Orchestration Privacy Risk" (TOP-R), bei dem autonome Agenten durch die Kombination nicht-sensitiver Datenfragmente sensible Informationen ableiten, und stellt mit TOP-Bench, dem H-Score sowie wirksamen Minderungsstrategien einen systematischen Rahmen zur Bewertung und Lösung dieses Problems bereit.

Yuxuan Qiao, Dongqin Liu, Hongchang Yang, Wei Zhou, Songlin HuMon, 09 Ma🤖 cs.AI

Window-based Membership Inference Attacks Against Fine-tuned Large Language Models

Die vorgestellte Arbeit führt die Window-Based Comparison (WBC)-Methode ein, die durch die Analyse lokaler Kontextfenster anstelle globaler Durchschnitte die Wirksamkeit von Membership-Inference-Angriffen auf feinabgestimmte Large Language Models erheblich steigert und damit signifikante Datenschutzlücken aufdeckt.

Yuetian Chen, Yuntao Du, Kaiyuan Zhang, Ashish Kundu, Charles Fleming, Bruno Ribeiro, Ninghui LiMon, 09 Ma🤖 cs.AI

Peak + Accumulation: A Proxy-Level Scoring Formula for Multi-Turn LLM Attack Detection

Die vorgestellte Arbeit schlägt eine neue Proxy-Level-Scoring-Formel namens „Peak + Accumulation" vor, die durch die Kombination von Spitzenrisiko, Persistenz und Kategoriediversität Multi-Turn-Prompt-Injection-Angriffe ohne LLM-Einsatz mit hoher Genauigkeit erkennt und dabei die Schwächen herkömmlicher gewichteter Durchschnittsmethoden überwindet.

J Alex CorllMon, 09 Ma🤖 cs.AI

Scrambler: Mixed Boolean Arithmetic Obfuscation Tool Using E-graph and Equality Expansion

Das Paper stellt Scrambler vor, ein auf E-Graphen und Gleichheitsexpansion basierendes Werkzeug zur Verschleierung gemischter boolescher Arithmetik, das durch konstruktionsbedingte Äquivalenzsicherung effizient komplexe und vielfältige Ausdrücke generiert und dabei bestehende Tools in Ausdrucksstärke und Komplexität übertrifft.

Seoksu Lee, Sangjun An, Eun-Sun ChoMon, 09 Ma💻 cs

Traversal-as-Policy: Log-Distilled Gated Behavior Trees as Externalized, Verifiable Policies for Safe, Robust, and Efficient Agents

Die Arbeit stellt „Traversal-as-Policy" vor, eine Methode, bei der aus erfolgreichen OpenHands-Executions-Logs ein ausführbarer, gate-gesteuerter Verhaltensbaum abgeleitet wird, der als externe, überprüfbare Richtlinie dient und damit die Erfolgsrate von LLM-Agenten signifikant steigert, während Sicherheitsverletzungen nahezu eliminiert und die Kosten gesenkt werden.

Peiran Li, Jiashuo Sun, Fangzhou Lin, Shuo Xing, Tianfu Fu, Suofei Feng, Chaoqun Ni, Zhengzhong TuMon, 09 Ma🤖 cs.AI

Information-Theoretic Privacy Control for Sequential Multi-Agent LLM Systems

Diese Arbeit untersucht die kumulative Privatsphärenverletzung in sequenziellen Multi-Agenten-LLM-Systemen, leitet theoretische Grenzen für die Informationsleckage ab und schlägt ein regularisiertes Trainingsframework vor, das Privatsphäre als systemweite Eigenschaft sicherstellt, anstatt sich nur auf lokale Einschränkungen zu verlassen.

Sadia Asif, Mohammad Mohammadi AmiriMon, 09 Ma🤖 cs.LG

Ecosystem Trust Profiles

Dieses Paper stellt das Konzept der Ökosystem-Vertrauensprofile vor, um die autonome Definition und den Austausch von Vertrauensnachweisen zwischen digitalen Ökosystemen zu ermöglichen, und beweist, dass die Interoperabilität zwischen Datenräumen exakt durch den Grad der Gemeinsamkeit in deren Vertrauensprofilen bestimmt wird, wobei ein Fragilitäts-Theorem die Notwendigkeit zusätzlicher Governance-Mechanismen zur Aufrechterhaltung stabilen Vertrauens bei voller Souveränität aufzeigt.

Christoph F. StrnadlMon, 09 Ma💻 cs

Privacy-Preserving Collaborative Medical Image Segmentation Using Latent Transform Networks

Die Arbeit stellt ein privatsphäreschonendes Framework (PPCMI-SF) für die kollaborative medizinische Bildsegmentierung vor, das durch verschlüsselte latente Transformationen und serverseitige Übersetzung eine hohe Segmentierungsgenauigkeit über mehrere Institutionen hinweg ermöglicht, ohne dass sensible Rohdaten geteilt werden müssen.

Saheed Ademola Bello, Muhammad Shahid Jabbar, Muhammad Sohail Ibrahim, Shujaat KhanMon, 09 Ma💻 cs

← Zurück Weiter →