cs.CR Arbeiten | Gist.Science

Shadow in the Cache: Unveiling and Mitigating Privacy Risks of KV-cache in LLM Inference

Die Arbeit analysiert erstmals die Privatsphärenrisiken des KV-Cache bei LLM-Inferenz, demonstriert durch drei Angriffsvektoren die Rekonstruktion sensibler Eingaben und stellt mit KV-Cloak eine leichte, effiziente Verteidigung vor, die diese Angriffe ohne Genauigkeitsverlust oder nennenswerte Leistungseinbußen abwehrt.

Zhifan Luo, Shuo Shao, Su Zhang, Lijing Zhou, Yuke Hu, Chenxu Zhao, Zhihao Liu, Zhan QinThu, 12 Ma💬 cs.CL

Hierarchical Dual-Strategy Unlearning for Biomedical and Healthcare Intelligence Using Imperfect and Privacy-Sensitive Medical Data

Die vorgestellte Arbeit präsentiert einen hierarchischen Dual-Strategie-Ansatz zum selektiven Vergessen spezifischen Wissens in medizinischen Large Language Models, der durch geometrisch eingeschränkte Gradientenupdates und token-level Interventionen eine hohe Privatsphäre bei gleichzeitiger Erhaltung grundlegender medizinischer Kompetenzen gewährleistet.

Yi Zhang, Chao Zhang, Zijian Li, Tianxiang Xu, Kunyu Zhang, Zhan Gao, Meinuo Li, Xiaohan Zhang, Qichao Qi, Bing ChenThu, 12 Ma🤖 cs.LG

Burn-After-Use for Preventing Data Leakage through a Secure Multi-Tenant Architecture in Enterprise LLM

Diese Studie stellt eine sichere Multi-Tenant-Architektur (SMTA) in Kombination mit einem neuartigen „Burn-After-Use"-Mechanismus vor, der durch strikte Isolation und automatische Vernichtung von Kontextdaten nach der Nutzung das Risiko von Datenlecks in unternehmensinternen LLM-Umgebungen effektiv minimiert.

Qiang Zhang, Elena Emma Wang, Jiaming Li, Xichun WangThu, 12 Ma🤖 cs.AI

Beyond Max Tokens: Stealthy Resource Amplification via Tool Calling Chains in LLM Agents

Diese Arbeit stellt einen neuen, schwer erkennbaren Denial-of-Service-Angriff auf LLM-Agenten vor, der durch manipulierte Tool-Aufrufketten im Rahmen des Model Context Protocol (MCP) die Kosten und den Ressourcenverbrauch um ein Vielfaches erhöht, ohne dass herkömmliche Filter dies erkennen.

Kaiyu Zhou, Yongsen Zheng, Yicheng He, Meng Xue, Xueluan Gong, Yuji Wang, Xuanye Zhang, Kwok-Yan LamThu, 12 Ma🤖 cs.AI

Adversarial Hubness Detector: Detecting Hubness Poisoning in Retrieval-Augmented Generation Systems

Die Arbeit stellt Hubscan vor, einen Open-Source-Sicherheitsscanner, der durch eine Multi-Detektor-Architektur und statistische Analysen „Hubness"-Angriffe in Retrieval-Augmented-Generation-Systemen effektiv identifiziert und dabei eine hohe Trefferquote bei minimalen Fehlalarmen erreicht.

Idan Habler, Vineeth Sai Narajala, Stav Koren, Amy Chang, Tiffany SaadeThu, 12 Ma🤖 cs.AI

Defensive Refusal Bias: How Safety Alignment Fails Cyber Defenders

Die Studie zeigt, dass sicherheitsausgerichtete KI-Modelle legitime Cyber-Verteidigungsaufgaben aufgrund von semantischen Ähnlichkeiten mit Angriffsszenarien übermäßig ablehnen, was insbesondere bei kritischen Aufgaben wie Systemhärtung und Malware-Analyse zu einem signifikanten „Defensive Refusal Bias" führt, der durch explizite Autorisierung sogar verschärft wird.

David Campbell, Neil Kale, Udari Madhushani Sehwag, Bert Herring, Nick Price, Dan Borges, Alex Levinson, Christina Q KnightThu, 12 Ma🤖 cs.AI

Kraken: Higher-order EM Side-Channel Attacks on DNNs in Near and Far Field

Die Arbeit „Kraken" demonstriert erstmals die Extraktion von Parametern aus GPU-Tensor-Cores mittels Nahfeld-Seitenkanalangriffen und zeigt zudem, dass selbst aus 100 cm Entfernung durch eine Glasbarriere hindurch Informationen über Gewichte und Hyperparameter von LLMs abgegriffen werden können.

Peter Horvath, Ilia Shumailov, Lukasz Chmielewski, Lejla Batina, Yuval YaromThu, 12 Ma💻 cs

There Are No Silly Questions: Evaluation of Offline LLM Capabilities from a Turkish Perspective

Diese Studie bewertet die Robustheit und pädagogische Sicherheit von offline einsetzbaren Large Language Models im Kontext des Türkisch-Unterrichts und stellt fest, dass Modelle mit 8 bis 14 Milliarden Parametern den besten Kompromiss zwischen Kosten und Sicherheit bieten, wobei Anomaliewiderstand nicht allein von der Modellgröße abhängt.

Edibe Yilmaz, Kahraman KostasThu, 12 Ma💬 cs.CL

Evaluating Generalization Mechanisms in Autonomous Cyber Attack Agents

Die Studie zeigt, dass autonome Cyber-Angreifer-Agenten durch IP-Adressänderungen in ihrer Generalisierungsfähigkeit stark beeinträchtigt werden, wobei zwar promptgesteuerte LLM-Agenten die höchste Erfolgswahrscheinlichkeit aufweisen, dies jedoch auf Kosten von Rechenleistung, Transparenz und Zuverlässigkeit geht.

Ondřej Lukáš, Jihoon Shin, Emilia Rivas, Diego Forni, Maria Rigaki, Carlos Catania, Aritran Piplai, Christopher Kiekintveld, Sebastian GarciaThu, 12 Ma💻 cs

Targeted Bit-Flip Attacks on LLM-Based Agents

Die Studie stellt Flip-Agent vor, das erste gezielte Bit-Flip-Angriffsframework für LLM-basierte Agenten, das durch Manipulation von Hardware-Fehlern sowohl Endausgaben als auch Tool-Aufrufe in realen Szenarien effektiv sabotiert.

Jialai Wang, Ya Wen, Zhongmou Liu, Yuxiao Wu, Bingyi He, Zongpeng Li, Ee-Chien ChangThu, 12 Ma🤖 cs.AI

Where Do Flow Semantics Reside? A Protocol-Native Tabular Pretraining Paradigm for Encrypted Traffic Classification

Die Arbeit stellt FlowSem-MAE vor, einen tabellenbasierten Masked Autoencoder, der durch die Berücksichtigung protokollspezifischer Feldsemantik und die Vermeidung von Induktionsverzerrungen bei der Verschlüsselungstraffik-Klassifizierung den aktuellen Stand der Technik übertrifft und dabei deutlich weniger gelabelte Daten benötigt.

Sizhe Huang, Shujie YangThu, 12 Ma🤖 cs.AI

OAuthHub: Mitigating OAuth Data Overaccess through a Local Data Hub

Die Arbeit stellt OAuthHub vor, ein Entwicklungsframework, das persönliche Geräte als lokale Daten-Hubs nutzt, um den übermäßigen Zugriff auf OAuth-Daten zu reduzieren und Entwicklern dabei hilft, Anwendungen mit weniger Code und höherer Effizienz zu erstellen.

Qiyu Li, Yuhe Tian, Haojian JinThu, 12 Ma💻 cs

SBOMs into Agentic AIBOMs: Schema Extensions, Agentic Orchestration, and Reproducibility Evaluation

Diese Arbeit stellt einen agenten Rahmen für künstliche Intelligenz-Rechnungen (AIBOMs) vor, der statische Software-Bills-of-Materials durch autonome Multi-Agenten-Systeme in dynamische, kontextbewusste Nachweisartefakte erweitert, um Reproduzierbarkeit und Schwachstellenbewertung unter sich ändernden Laufzeitbedingungen zu verbessern.

Petar Radanliev, Carsten Maple, Omar Santos, Kayvan AtefiThu, 12 Ma🤖 cs.AI

Tool Receipts, Not Zero-Knowledge Proofs: Practical Hallucination Detection for AI Agents

Das Paper stellt NabaOS vor, ein leichtgewichtiges Verifizierungsframework, das auf der indischen Erkenntnistheorie Nyaya Shastra basiert und durch HMAC-signierte Tool-Empfangsbestätigungen in Echtzeit Halluzinationen von KI-Agenten mit minimalem Latenzüberhead erkennt, wodurch es die Unpraktikabilität kryptografischer Zero-Knowledge-Beweise für interaktive Anwendungen überwindet.

Abhinaba BasuThu, 12 Ma🤖 cs.AI

Building Privacy-and-Security-Focused Federated Learning Infrastructure for Global Multi-Centre Healthcare Research

Die Studie stellt FLA³ vor, eine governance-fähige Plattform für das föderierte Lernen, die durch integrierte Authentifizierungs-, Autorisierungs- und Abrechnungsmechanismen (AAA) datenschutzkonforme, grenzüberschreitende medizinische Forschung ermöglicht und dabei eine mit zentralisiertem Training vergleichbare Vorhersagegenauigkeit bei 54.446 Blutproben aus 25 Zentren demonstriert.

Fan Zhang, Daniel Kreuter, Javier Fernandez-Marques, BloodCounts Consortium, Gregory Verghese, Bernard Butler, Nicholas Lane, Suthesh Sivapalaratnam, Joseph Taylor, Norbert C. J. de Wit, Nicholas S. Gleadall, Carola-Bibiane Schönlieb, Michael RobertsThu, 12 Ma💻 cs

ADVERSA: Measuring Multi-Turn Guardrail Degradation and Judge Reliability in Large Language Models

Die Studie ADVERSA stellt ein automatisiertes Red-Teaming-Framework vor, das die Degradierung von Sicherheitsguardrails in großen Sprachmodellen über mehrere Gesprächsrunden hinweg als kontinuierliche Trajektorien misst und dabei die Zuverlässigkeit von Bewertungsmodellen sowie das Phänomen früher Jailbreaks in den Vordergrund stellt.

Harry Owiredu-AshleyThu, 12 Ma🤖 cs.AI

Why LLMs Fail: A Failure Analysis and Partial Success Measurement for Automated Security Patch Generation

Die Studie analysiert das Versprechen und die Grenzen von Large Language Models bei der automatisierten Behebung von Java-Sicherheitslücken und zeigt, dass diese zwar oft funktionale Integrität bewahren, jedoch aufgrund semantischer Missverständnisse in der Hälfte der Fälle sowohl Sicherheits- als auch Funktionsanforderungen verfehlen.

Amir Al-MaamariThu, 12 Ma🤖 cs.AI

TASER: Task-Aware Spectral Energy Refine for Backdoor Suppression in UAV Swarms Decentralized Federated Learning

Die Arbeit stellt TASER vor, ein dezentrales Verteidigungsframework für UAV-Schwärme, das durch die Analyse und gezielte Filterung spektraler Energieverteilungen in Gradienten effizient und robust gegen ausgeklügelte Backdoor-Angriffe vorgeht, ohne auf komplexe Ausreißererkennung angewiesen zu sein.

Sizhe Huang, Shujie YangThu, 12 Ma🤖 cs.AI

Amnesia: Adversarial Semantic Layer Specific Activation Steering in Large Language Models

Die Studie stellt „Amnesia" vor, einen leichten adversarialen Angriff im Aktivierungsraum, der durch Manipulation interner Transformer-Zustände Sicherheitsmechanismen in offenen Large Language Models umgeht und so die Erzeugung schädlicher Inhalte ohne Nachtraining ermöglicht.

Ali Raza, Gurang Gupta, Nikolay Matyunin, Jibesh PatraThu, 12 Ma🤖 cs.AI

Multi-Stream Perturbation Attack: Breaking Safety Alignment of Thinking LLMs Through Concurrent Task Interference

Die vorgestellte Arbeit führt einen Multi-Stream-Perturbation-Angriff ein, der durch das gleichzeitige Verflechten mehrerer Aufgabenströme den Sicherheitsabgleich von denkenden LLMs umgeht und dabei zu einem Zusammenbruch des Denkprozesses sowie zu wiederholten Ausgaben führt.

Fan YangThu, 12 Ma🤖 cs.AI

← Zurück Weiter →