cs.CR papers | Gist.Science

AttriGuard: Defeating Indirect Prompt Injection in LLM Agents via Causal Attribution of Tool Invocations

Het paper introduceert AttriGuard, een runtime-benadering die indirecte prompt-injectie in LLM-agenten effectief bestrijdt door tooloproepen te verifiëren via causale attributie en contrafactuele tests om te onderscheiden tussen acties die voortvloeien uit de gebruikersintentie en die welke door onbetrouwbare externe observaties worden veroorzaakt.

Yu He, Haozhe Zhu, Yiming Li, Shuo Shao, Hongwei Yao, Zhihao Liu, Zhan QinThu, 12 Ma💻 cs

A PUF-Based Approach for Copy Protection of Intellectual Property in Neural Network Models

Dit paper presenteert een aanpak die fysiek onkloonbare functies (PUF's) gebruikt om de gewichten van neurale netwerken te koppelen aan unieke hardware-eigenschappen, waardoor het kopiëren van deze modellen naar gekloonde hardware onmogelijk wordt gemaakt en de intellectuele eigendom effectief wordt beschermd.

Daniel Dorfmeister, Flavio Ferrarotti, Bernhard Fischer, Martin Schwandtner, Hannes SochorThu, 12 Ma🤖 cs.LG

Incremental Federated Learning for Intrusion Detection in IoT Networks under Evolving Threat Landscape

Deze studie analyseert de prestaties van incrementeel federatief leren met LSTM-modellen op de CICIoMT2024-dataset om robuuste en privacy-bewuste intrusiedetectiesystemen voor IoT-netwerken te ontwikkelen die effectief omgaan met conceptdrift en beperkte rekenkracht.

Muaan Ur Rehman, Hayretdin Bahs, Rajesh KalakotiThu, 12 Ma💻 cs

Re-Evaluating EVMBench: Are AI Agents Ready for Smart Contract Security?

Deze studie weerlegt de optimistische conclusies van EVMbench over de onmiddellijke bruikbaarheid van volledig geautomatiseerde AI-audits voor smart contracts door aan te tonen dat de prestaties van agenten instabiel zijn, gevoelig voor data-verontreiniging en afhankelijk van de gebruikte scaffolding, waardoor menselijke expertise in een 'human-in-the-loop'-workflow onmisbaar blijft.

Chaoyuan Peng, Lei Wu, Yajin ZhouThu, 12 Ma💻 cs

Backdoor Directions in Vision Transformers

Dit artikel onderzoekt hoe backdoor-aanvallen in Vision Transformers worden gerepresenteerd door een specifieke 'trigger-richting' te identificeren die causaal de kwaadaardige gedraging beïnvloedt, en gebruikt deze inzichten om de interne verwerking van triggers te analyseren en een data-vrije detectiemethode voor stealthy-aanvallen te ontwikkelen.

Sengim Karayalcin, Marina Krcek, Pin-Yu Chen, Stjepan PicekThu, 12 Ma💻 cs

MAD: Memory Allocation meets Software Diversity

Het paper introduceert MAD, een nieuwe aanpak die geheugenallocatie combineert met softwarediversiteit om RowHammer-aanvallen te vertragen door middel van ruimtelijke diversificatie, waardoor de aanval wordt uitgesteld voor verdere reacties zonder prestatieverlies of hardwarewijzigingen.

Manuel Wiesinger, Daniel Dorfmeister, Stefan BrunthalerThu, 12 Ma💻 cs

TOSSS: a CVE-based Software Security Benchmark for Large Language Models

Dit paper introduceert TOSSS, een op CVE's gebaseerde benchmark die de veiligheid van Large Language Models evalueert door hun vermogen te meten om tussen veilige en kwetsbare codefragmenten te kiezen, waarbij geteste modellen scores tussen 0,48 en 0,89 behalen.

Marc Damie, Murat Bilgehan Ertan, Domenico Essoussi, Angela Makhanu, Gaëtan Peter, Roos WensveenThu, 12 Ma🤖 cs.LG

Layered Performance Analysis of TLS 1.3 Handshakes: Classical, Hybrid, and Pure Post-Quantum Key Exchange

Dit artikel presenteert een laboratoriumstudie die de impact van klassieke, hybride en zuivere post-kwantum cryptografie op de prestaties van meerdere lagen van TLS 1.3-handshakes in HTTP-transacties analyseert.

David Gómez-Cambronero, Daniel Munteanu, Ana Isabel González-TablasThu, 12 Ma💻 cs

Separating Oblivious and Adaptive Differential Privacy under Continual Observation

Dit papier lost een open vraag op door een expliciet voorbeeld te presenteren dat aantoont dat er een fundamenteel verschil bestaat tussen de oblivious en adaptieve settings van differentieel privacy onder continue observatie, waarbij het oblivious model aanzienlijk beter presteert dan het adaptieve model.

Mark Bun, Marco Gaboardi, Connor WagamanThu, 12 Ma💻 cs

Adversarial Robustness of Partitioned Quantum Classifiers

Dit artikel onderzoekt de kwetsbaarheid van gepartitioneerde kwantumbesturders voor adversariale perturbaties die circuit-cutting of quantum-teleportatie beïnvloeden, en onthult een fundamenteel verband tussen dergelijke aanvallen en het implementeren van kwaadaardige poorten in de tussenliggende lagen van een kwantumclassificatie.

Pouya Kananian, Hans-Arno JacobsenMon, 09 Ma⚛️ quant-ph

HVAC-EAR: Eavesdropping Human Speech Using HVAC Systems

Dit paper introduceert HVAC-EAR, een systeem dat intelligibele spraak kan reconstrueren uit ruisende drukdata van HVAC-systemen door een complex-waardige conformer te gebruiken, waardoor voor het eerst privacyrisico's oplopen tot 1,2 meter afstand worden aangetoond.

Tarikul Islam Tamiti, Biraj Joshi, Rida Hasan, Anomadarshi BaruaMon, 09 Ma💻 cs

SPARK: Jailbreaking T2V Models by Synergistically Prompting Auditory and Recontextualized Knowledge

Het artikel introduceert SPARK, een jailbreak-framework dat T2V-modellen omzeilt door veilige prompts te combineren met neutrale scènes, sluwe auditieve triggers en cinematografische richtlijnen om verborgen onveilige video's te genereren.

Zonghao Ying, Moyang Chen, Nizhang Li, Zhiqiang Wang, Wenxin Zhang, Quanchen Zou, Zonglei Jing, Aishan Liu, Xianglong LiuMon, 09 Ma💻 cs

Agent Tools Orchestration Leaks More: Dataset, Benchmark, and Mitigation

Dit artikel introduceert het concept van Tools Orchestration Privacy Risk (TOP-R), waarbij autonome agenten via LLM's onbedoeld gevoelige informatie synthetiseren uit niet-gevoelige tool-data, en biedt de eerste systematische analyse, een nieuw benchmark (TOP-Bench) en effectieve mitigatiestrategieën om dit privacyrisico aan te pakken.

Yuxuan Qiao, Dongqin Liu, Hongchang Yang, Wei Zhou, Songlin HuMon, 09 Ma🤖 cs.AI

Window-based Membership Inference Attacks Against Fine-tuned Large Language Models

Deze paper introduceert WBC, een nieuw aanvalsmodel dat de effectiviteit van lidmaatschapsinference-aanvallen op fine-tuned grote taalmodellen aanzienlijk verbetert door lokale, contextgebonden geheugensignalen te analyseren in plaats van te vertrouwen op globale gemiddelden.

Yuetian Chen, Yuntao Du, Kaiyuan Zhang, Ashish Kundu, Charles Fleming, Bruno Ribeiro, Ninghui LiMon, 09 Ma🤖 cs.AI

Peak + Accumulation: A Proxy-Level Scoring Formula for Multi-Turn LLM Attack Detection

Dit paper introduceert een nieuwe "peak + accumulation"-scoringsformule die per-ronde risico's effectief aggregeert tot een conversatie-niveau risicoscore voor multi-turn prompt-injectie-aanvallen, en bereikt hiermee 90,8% recall bij een lage false-positive rate zonder gebruik van een LLM.

J Alex CorllMon, 09 Ma🤖 cs.AI

Scrambler: Mixed Boolean Arithmetic Obfuscation Tool Using E-graph and Equality Expansion

Het paper introduceert Scrambler, een e-graafgebaseerde tool voor Mixed Boolean Arithmetic-obfuscatie die via gelijkheidsuitbreiding efficiënt complexe en diverse expressies genereert met gegarandeerde equivalentie.

Seoksu Lee, Sangjun An, Eun-Sun ChoMon, 09 Ma💻 cs

Traversal-as-Policy: Log-Distilled Gated Behavior Trees as Externalized, Verifiable Policies for Safe, Robust, and Efficient Agents

Het artikel introduceert Traversal-as-Policy, een methode die OpenHands-uitvoeringslogs distilleert tot een uitvoerbaar, verifieerbaar Gated Behavior Tree-beleid dat autonome agents veiliger, robuuster en efficiënter maakt door het onbeperkte genereren te vervangen door gestructureerde boomtraversie met deterministische veiligheidscontroles.

Peiran Li, Jiashuo Sun, Fangzhou Lin, Shuo Xing, Tianfu Fu, Suofei Feng, Chaoqun Ni, Zhengzhong TuMon, 09 Ma🤖 cs.AI

Information-Theoretic Privacy Control for Sequential Multi-Agent LLM Systems

Dit artikel introduceert een theoretisch kader en een privacy-geregulariseerd trainingsframework om compositiegevoelige privacylekkage in sequentiële multi-agent LLM-systemen te beperken, waarbij wordt aangetoond dat privacy een systeemkarakteristiek is die niet alleen door lokale beperkingen kan worden gegarandeerd.

Sadia Asif, Mohammad Mohammadi AmiriMon, 09 Ma🤖 cs.LG

Ecosystem Trust Profiles

Dit artikel introduceert 'ecosystem trust profiles' als een methode om digitale ecosystemen en data spaces autonome, soevereine maar onderling interoperabele vertrouwenssystemen te laten definiëren, waarbij de mate van interoperabiliteit exact wordt bepaald door de gemeenschappelijkheid in deze vertrouwensprofielen.

Christoph F. StrnadlMon, 09 Ma💻 cs

Privacy-Preserving Collaborative Medical Image Segmentation Using Latent Transform Networks

Dit artikel introduceert het PPCMI-SF-framework, een privacybehoudend systeem voor samenwerking tussen medische instellingen dat door middel van cryptografisch versleutelde latenterepresentaties en een server-zijde vertaalmapping nauwkeurige beeldsegmentatie mogelijk maakt zonder dat gevoelige patiëntdata gedeeld hoeft te worden.

Saheed Ademola Bello, Muhammad Shahid Jabbar, Muhammad Sohail Ibrahim, Shujaat KhanMon, 09 Ma💻 cs

← Vorige Volgende →