cs.CR articles | Gist.Science

AttriGuard: Defeating Indirect Prompt Injection in LLM Agents via Causal Attribution of Tool Invocations

Le papier présente AttriGuard, un mécanisme de défense innovant qui protège les agents LLM contre les injections de prompts indirectes en utilisant l'attribution causale et des tests contrefactuels pour distinguer les appels d'outils légitimes de ceux manipulés par des données non fiables.

Yu He, Haozhe Zhu, Yiming Li, Shuo Shao, Hongwei Yao, Zhihao Liu, Zhan QinThu, 12 Ma💻 cs

A PUF-Based Approach for Copy Protection of Intellectual Property in Neural Network Models

Cet article propose une méthode de protection des droits de propriété intellectuelle dans les réseaux de neurones en liant leurs poids à des caractéristiques matérielles uniques via des fonctions physiques non clonables (PUF), rendant ainsi l'exécution du modèle impossible sur du matériel cloné.

Daniel Dorfmeister, Flavio Ferrarotti, Bernhard Fischer, Martin Schwandtner, Hannes SochorThu, 12 Ma🤖 cs.LG

Incremental Federated Learning for Intrusion Detection in IoT Networks under Evolving Threat Landscape

Cette étude propose une analyse de l'apprentissage fédéré incrémental avec des modèles LSTM pour améliorer la résilience des systèmes de détection d'intrusion dans les réseaux IoT face au dérive conceptuelle, en démontrant que les méthodes d'apprentissage cumulatif et représentatif offrent les performances les plus stables tout en respectant les contraintes de ressources.

Muaan Ur Rehman, Hayretdin Bahs, Rajesh KalakotiThu, 12 Ma💻 cs

Re-Evaluating EVMBench: Are AI Agents Ready for Smart Contract Security?

Cette étude remet en question la fiabilité du benchmark EVMbench en démontrant que les agents d'IA actuels, dont les performances varient selon la configuration et sont limitées par des risques de contamination des données, ne peuvent pas encore remplacer l'audit humain mais doivent être intégrés dans un flux de travail collaboratif pour la sécurité des contrats intelligents.

Chaoyuan Peng, Lei Wu, Yajin ZhouThu, 12 Ma💻 cs

Backdoor Directions in Vision Transformers

Cette étude explore la représentation des attaques par porte dérobée dans les Transformers visuels en identifiant et en validant causalement une « direction de déclencheur » spécifique, permettant de distinguer les mécanismes internes des différents types de déclencheurs et de proposer une méthode de détection sans données.

Sengim Karayalcin, Marina Krcek, Pin-Yu Chen, Stjepan PicekThu, 12 Ma💻 cs

MAD: Memory Allocation meets Software Diversity

Le papier présente MAD, une approche innovante combinant l'allocation mémoire et la diversité logicielle pour contrer les attaques RowHammer en retardant leur succès grâce à des techniques de diversification spatiale, le tout avec une mise en œuvre facile et un impact de performance négligeable.

Manuel Wiesinger, Daniel Dorfmeister, Stefan BrunthalerThu, 12 Ma💻 cs

TOSSS: a CVE-based Software Security Benchmark for Large Language Models

Ce papier présente TOSSS, un nouveau benchmark basé sur la base de données CVE permettant d'évaluer la capacité des modèles de langage à distinguer le code sécurisé du code vulnérable, révélant des scores de sécurité variables parmi 14 modèles testés.

Marc Damie, Murat Bilgehan Ertan, Domenico Essoussi, Angela Makhanu, Gaëtan Peter, Roos WensveenThu, 12 Ma🤖 cs.LG

Layered Performance Analysis of TLS 1.3 Handshakes: Classical, Hybrid, and Pure Post-Quantum Key Exchange

Cette étude de laboratoire analyse l'impact des algorithmes de cryptographie post-quantique sur les performances des transactions HTTP sur TLS 1.3 à travers plusieurs couches, en comparant les échanges de clés traditionnels, hybrides et purement post-quantiques dans un scénario de charge simulée.

David Gómez-Cambronero, Daniel Munteanu, Ana Isabel González-TablasThu, 12 Ma💻 cs

Separating Oblivious and Adaptive Differential Privacy under Continual Observation

Cet article résout une question ouverte en démontrant la première séparation explicite entre la confidentialité différentielle aveugle et adaptative dans le modèle d'observation continue, en présentant un algorithme précis pour le premier cas qui échoue systématiquement dans le second après un nombre constant d'étapes.

Mark Bun, Marco Gaboardi, Connor WagamanThu, 12 Ma💻 cs

Adversarial Robustness of Partitioned Quantum Classifiers

Cet article examine la robustesse des classificateurs quantiques partitionnés face aux perturbations adverses ciblant le découpage de circuits ou la téléportation, en établissant un lien théorique et expérimental entre ces attaques et l'implémentation de portes adverses au sein des couches intermédiaires du modèle.

Pouya Kananian, Hans-Arno JacobsenMon, 09 Ma⚛️ quant-ph

HVAC-EAR: Eavesdropping Human Speech Using HVAC Systems

Ce papier présente HVAC-EAR, un système capable de reconstruire intelligiblement la parole humaine à partir de données de pression bruyantes et de faible résolution provenant de capteurs HVAC, révélant ainsi de nouvelles vulnérabilités de confidentialité jusqu'à 1,2 mètre de distance.

Tarikul Islam Tamiti, Biraj Joshi, Rida Hasan, Anomadarshi BaruaMon, 09 Ma💻 cs

SPARK: Jailbreaking T2V Models by Synergistically Prompting Auditory and Recontextualized Knowledge

Ce papier présente SPARK, un cadre d'attaque par contournement (jailbreak) pour les modèles texte-vers-vidéo qui exploite des indices auditifs latents et des connaissances recontextualisées dans des prompts apparemment anodins pour générer du contenu non sécurisé tout en évitant les défenses.

Zonghao Ying, Moyang Chen, Nizhang Li, Zhiqiang Wang, Wenxin Zhang, Quanchen Zou, Zonglei Jing, Aishan Liu, Xianglong LiuMon, 09 Ma💻 cs

Agent Tools Orchestration Leaks More: Dataset, Benchmark, and Mitigation

Cet article présente une étude systématique du risque de confidentialité lié à l'orchestration d'outils par les agents autonomes, introduisant un cadre formel, un benchmark (TOP-Bench) et des stratégies d'atténuation pour prévenir la synthèse involontaire d'informations sensibles à partir de fragments non sensibles.

Yuxuan Qiao, Dongqin Liu, Hongchang Yang, Wei Zhou, Songlin HuMon, 09 Ma🤖 cs.AI

Window-based Membership Inference Attacks Against Fine-tuned Large Language Models

Ce papier présente WBC, une nouvelle méthode d'attaque par inférence de membre qui surpasse les approches existantes en exploitant des signaux de mémorisation localisés via une comparaison glissante de fenêtres, révélant ainsi des vulnérabilités critiques de confidentialité dans les grands modèles de langage affinés.

Yuetian Chen, Yuntao Du, Kaiyuan Zhang, Ashish Kundu, Charles Fleming, Bruno Ribeiro, Ninghui LiMon, 09 Ma🤖 cs.AI

Peak + Accumulation: A Proxy-Level Scoring Formula for Multi-Turn LLM Attack Detection

Ce papier propose une formule de notation « pic + accumulation » au niveau du proxy pour détecter les injections de prompts multi-tours en combinant le risque maximal par tour, la persistance et la diversité des catégories, atteignant ainsi 90,8 % de rappel avec un taux de faux positifs de 1,20 % sans recourir à un LLM.

J Alex CorllMon, 09 Ma🤖 cs.AI

Scrambler: Mixed Boolean Arithmetic Obfuscation Tool Using E-graph and Equality Expansion

Ce papier présente Scrambler, un outil d'obfuscation arithmétique booléenne mixte basé sur les graphes d'égalité et l'expansion d'égalité, qui génère efficacement des expressions complexes et diversifiées tout en garantissant leur équivalence par construction.

Seoksu Lee, Sangjun An, Eun-Sun ChoMon, 09 Ma💻 cs

Traversal-as-Policy: Log-Distilled Gated Behavior Trees as Externalized, Verifiable Policies for Safe, Robust, and Efficient Agents

Ce papier propose Traversal-as-Policy, une méthode qui transforme les logs d'exécution OpenHands en arbres de comportement à portes (GBT) exécutables pour remplacer la génération de politique implicite par une navigation contrôlée et vérifiable, améliorant ainsi considérablement le taux de réussite, la sécurité et l'efficacité des agents LLM sur des tâches complexes.

Peiran Li, Jiashuo Sun, Fangzhou Lin, Shuo Xing, Tianfu Fu, Suofei Feng, Chaoqun Ni, Zhengzhong TuMon, 09 Ma🤖 cs.AI

Information-Theoretic Privacy Control for Sequential Multi-Agent LLM Systems

Cet article propose un cadre d'entraînement régularisé pour contrôler la fuite d'information compositionnelle dans les systèmes séquentiels multi-agents LLM, démontrant que la confidentialité doit être traitée comme une propriété systémique plutôt que locale.

Sadia Asif, Mohammad Mohammadi AmiriMon, 09 Ma🤖 cs.LG

Ecosystem Trust Profiles

Ce papier propose les « profils de confiance des écosystèmes » comme méthode permettant aux écosystèmes numériques d'autonomiser la définition et l'interopérabilité de leurs relations de confiance tout en préservant leur souveraineté, démontrant que l'interopérabilité entre deux espaces de données est strictement déterminée par la similarité de leurs profils de confiance.

Christoph F. StrnadlMon, 09 Ma💻 cs

Privacy-Preserving Collaborative Medical Image Segmentation Using Latent Transform Networks

Cet article présente le PPCMI-SF, un cadre collaboratif de segmentation d'images médicales qui préserve la confidentialité des données en utilisant des transformées latentes chiffrées et des autoencodeurs, permettant ainsi d'atteindre une précision élevée et une robustesse contre les attaques sans partager les données brutes entre institutions.

Saheed Ademola Bello, Muhammad Shahid Jabbar, Muhammad Sohail Ibrahim, Shujaat KhanMon, 09 Ma💻 cs

← Précédent Suivant →