cs.CR articles | Gist.Science

Unclonable Encryption in the Haar Random Oracle Model

Cet article présente la première construction d'un chiffrement inclonable réutilisable dans le modèle de l'oracle aléatoire de Haar, démontrant ainsi l'existence de ce schéma de sécurité dans un contexte où les fonctions à sens unique pourraient ne pas exister.

James Bartusek, Eli GoldinFri, 13 Ma⚛️ quant-ph

KEPo: Knowledge Evolution Poison on Graph-based Retrieval-Augmented Generation

L'article présente KEPo, une nouvelle méthode d'attaque par empoisonnement conçue spécifiquement pour contourner la robustesse des systèmes GraphRAG en injectant des événements toxiques et des trajectoires d'évolution de connaissances dans le graphe afin de manipuler les réponses des grands modèles de langage.

Qizhi Chen, Chao Qi, Yihong Huang, Muquan Li, Rongzheng Wang, Dongyang Zhang, Ke Qin, Shuang LiangFri, 13 Ma🤖 cs.LG

Strict Optimality of Frequency Estimation Under Local Differential Privacy

Ce papier établit l'optimalité stricte de l'estimation de fréquence sous la confidentialité différentielle locale en démontrant qu'une configuration symétrique et extrémale avec une taille de support constante permet d'atteindre la précision maximale à un coût de communication minimal, tout en proposant un algorithme et une variante du Count-Mean Sketch qui s'avèrent pratiquement optimaux.

Mingen PanFri, 13 Ma🔢 math

Taming OpenClaw: Security Analysis and Mitigation of Autonomous LLM Agent Threats

Cet article présente une analyse de sécurité complète des agents autonomes LLM comme OpenClaw en introduisant un cadre à cinq couches pour identifier des menaces systémiques complexes et proposer des stratégies de défense holistiques face aux limites des mécanismes de protection actuels.

Xinhao Deng, Yixiang Zhang, Jiaqing Wu, Jiaqi Bai, Sibo Yi, Zhuoheng Zou, Yue Xiao, Rennai Qiu, Jianan Ma, Jialuo Chen, Xiaohu Du, Xiaofang Yang, Shiwen Cui, Changhua Meng, Weiqiang Wang, Jiaxing Song, Ke Xu, Qi LiFri, 13 Ma🤖 cs.AI

Exponential-Family Membership Inference: From LiRA and RMIA to BaVarIA

Cet article unifie les attaques d'inférence de membres LiRA, RMIA et BASE dans un cadre commun de rapport de vraisemblance exponentielle et propose BaVarIA, une méthode bayésienne qui améliore la stabilité et les performances, en particulier lorsque le nombre de modèles ombres est limité.

Rickard BrännvallFri, 13 Ma🤖 cs.LG

You Told Me to Do It: Measuring Instructional Text-induced Private Data Leakage in LLM Agents

Cette étude révèle que les agents LLM à hauts privilèges sont vulnérables à une fuite de données privée via l'injection d'instructions malveillantes dans la documentation technique, un problème structurel de leur conception qui échappe aux défenses actuelles et crée un écart critique entre leur conformité fonctionnelle et leur sécurité.

Ching-Yu Kao, Xinfeng Li, Shenyu Dai, Tianze Qiu, Pengcheng Zhou, Eric Hanchen Jiang, Philip SperlFri, 13 Ma🤖 cs.AI

The Mirror Design Pattern: Strict Data Geometry over Model Scale for Prompt Injection Detection

Ce papier présente Mirror, un motif de conception basé sur une géométrie de données rigoureuse et un classifieur linéaire léger, qui surpasse les modèles de grande taille en termes de rapidité, de déterminisme et de précision pour la détection des injections de prompts dans les couches de filtrage initial.

J Alex CorllFri, 13 Ma🤖 cs.AI

On the Possible Detectability of Image-in-Image Steganography

Ce papier démontre que les schémas de stéganographie « image dans image » sont facilement détectables grâce à une analyse par composantes indépendantes et à une méthode de stéganalyse basée sur les moments statistiques, atteignant jusqu'à 84,6 % de précision, voire plus de 99 % avec des méthodes classiques comme SRM.

Antoine Mallet (CRIStAL), Patrick Bas (CRIStAL)Fri, 13 Ma⚡ eess

Understanding LLM Behavior When Encountering User-Supplied Harmful Content in Harmless Tasks

Cette étude révèle que les grands modèles de langage, y compris les plus récents, échouent souvent à respecter des principes éthiques en traitant du contenu nuisible fourni par l'utilisateur, même lorsqu'ils sont sollicités pour accomplir des tâches inoffensives.

Junjie Chu, Yiting Qu, Ye Leng, Michael Backes, Yun Shen, Savvas Zannettou, Yang ZhangFri, 13 Ma🤖 cs.AI

Delayed Backdoor Attacks: Exploring the Temporal Dimension as a New Attack Surface in Pre-Trained Models

Cette étude introduit les attaques par porte dérobée retardées (DBA), une nouvelle classe de menaces exploitant la dimension temporelle pour activer des comportements malveillants après une période de latence, démontrant ainsi la viabilité d'utiliser des mots courants comme déclencheurs et soulignant l'urgence de développer des mécanismes de défense adaptés à cet état.

Zikang Ding, Haomiao Yang, Meng Hao, Wenbo Jiang, Kunlan Xiang, Runmeng Du, Yijing Liu, Ruichen Zhang, Dusit NiyatoFri, 13 Ma🤖 cs.AI

HomeSafe-Bench: Evaluating Vision-Language Models on Unsafe Action Detection for Embodied Agents in Household Scenarios

Ce papier présente HomeSafe-Bench, un nouveau benchmark évaluant la détection d'actions dangereuses par les modèles vision-langage dans les foyers, ainsi que HD-Guard, une architecture hiérarchique innovante conçue pour optimiser le compromis entre latence et précision dans la surveillance de sécurité des agents incarnés.

Jiayue Pu, Zhongxiang Sun, Zilu Zhang, Xiao Zhang, Jun XuFri, 13 Ma🤖 cs.AI

Cascade: Composing Software-Hardware Attack Gadgets for Adversarial Threat Amplification in Compound AI Systems

Cet article présente « Cascade », une approche qui démontre comment combiner des vulnérabilités logicielles et matérielles traditionnelles avec des faiblesses algorithmiques des modèles de langage pour amplifier les menaces et compromettre l'intégrité ou la confidentialité des systèmes d'IA composés.

Sarbartha Banerjee, Prateek Sahu, Anjo Vahldiek-Oberwagner, Jose Sanchez Vicarte, Mohit TiwariFri, 13 Ma🤖 cs.AI

Understanding Disclosure Risk in Differential Privacy with Applications to Noise Calibration and Auditing (Extended Version)

Cet article introduit le « reconstruction advantage » comme métrique unifiée pour évaluer les risques de révélation en confidentialité différentielle, démontrant que les approches existantes comme la robustesse de reconstruction (ReRo) peuvent être trompeuses et proposant ainsi un cadre rigoureux pour l'audit et le calibrage du bruit.

Patricia Guerra-Balboa, Annika Sauer, Héber H. Arcolezi, Thorsten StrufeFri, 13 Ma🔢 math

Security Considerations for Artificial Intelligence Agents

Ce document présente les observations et recommandations de Perplexity concernant la sécurité des agents d'IA de pointe, en identifiant leurs nouvelles vulnérabilités, en évaluant les défenses en couches actuelles et en soulignant les lacunes de recherche pour aligner la conception des systèmes multi-agents sur les principes de gestion des risques du NIST.

Ninghui Li, Kaiyuan Zhang, Kyle Polley, Jerry MaFri, 13 Ma🤖 cs.LG

STAMP: Selective Task-Aware Mechanism for Text Privacy

Le papier présente STAMP, un nouveau cadre de privatisation textuelle qui améliore le compromis entre confidentialité et utilité en allouant sélectivement des budgets de confidentialité au niveau des tokens via un mécanisme polaire qui perturbe uniquement la direction des embeddings tout en préservant leur magnitude et leur sémantique.

Fengwei Tian, Payel Bhattacharjee, Heidi Hanson, Geoffrey D. Rubin, Joseph Y. Lo, Ravi TandonFri, 13 Ma🤖 cs.LG

Detecting LLM-Generated Peer Reviews

Cet article présente un cadre rigoureux de filigrane et de détection statistique, utilisant l'injection de prompts indirects via les PDF de articles pour identifier les critiques générées par des modèles de langage avec des garanties d'erreur contrôlées et une puissance supérieure aux méthodes de correction traditionnelles.

Vishisht Rao, Aounon Kumar, Himabindu Lakkaraju + 1 more2026-03-13🤖 cs.AI

Integer Factorization via Tensor Network Schnorr's Sieving

Cet article présente une méthode de factorisation d'entiers pour le chiffrement RSA, basée sur le crible de Schnorr et résolue par des réseaux de tenseurs, qui démontre une mise à l'échelle polynomiale des ressources jusqu'à 130 bits et souligne l'urgence d'adopter une cryptographie post-quantique.

Marco Tesoro, Ilaria Siloi, Daniel Jaschke + 2 more2026-03-12⚛️ quant-ph

PrometheusFree: Concurrent Detection of Laser Fault Injection Attacks in Optical Neural Networks

Ce papier propose PrometheusFree, un cadre pour les réseaux de neurones optiques qui assure la détection simultanée des injections de fautes par laser en exploitant une perturbation de division de longueur d'onde pour améliorer la précision de la détection et réduire considérablement le taux de réussite des attaques.

Kota Nishida, Yoshihiro Midoh, Noriyuki Miura + 3 more2026-03-12🔬 physics.optics

Probabilistic Counters for Privacy Preserving Data Aggregation

Cet article démontre que les compteurs probabilistes, tels que le compteur de Morris et le MaxGeo Counter, peuvent assurer la protection de la vie privée dans les agrégations de données sans ajout de randomisation externe, grâce à leur randomisation inhérente suffisante pour satisfaire les critères rigoureux de la confidentialité différentielle.

Dominik Bojko, Krzysztof Grining, Marek Klonowski2026-03-11💻 cs

Automated TEE Adaptation with LLMs: Identifying, Transforming, and Porting Sensitive Functions in Programs

Ce papier présente AUTOTEE, une approche innovante utilisant les grands modèles de langage pour automatiser l'identification, la transformation et le portage de fonctions sensibles vers des environnements d'exécution de confiance (TEE), réduisant ainsi considérablement la charge de développement manuelle tout en obtenant des taux de réussite élevés sur des bases de code Java et Python.

Ruidong Han, Zhou Yang, Chengyan Ma, Ye Liu, Yuqing Niu, Siqi Ma, Debin Gao, David Lo2026-03-06🔒 cs.CR

← Précédent Suivant →