cs.CR articles | Gist.Science

Shadow in the Cache: Unveiling and Mitigating Privacy Risks of KV-cache in LLM Inference

Cet article révèle que le cache KV, essentiel à l'inférence des grands modèles de langage, expose des risques de confidentialité critiques permettant la reconstruction des entrées utilisateurs, et propose KV-Cloak, une méthode de défense légère et efficace qui sécurise ce cache sans dégrader les performances ni la précision du modèle.

Zhifan Luo, Shuo Shao, Su Zhang, Lijing Zhou, Yuke Hu, Chenxu Zhao, Zhihao Liu, Zhan QinThu, 12 Ma💬 cs.CL

Hierarchical Dual-Strategy Unlearning for Biomedical and Healthcare Intelligence Using Imperfect and Privacy-Sensitive Medical Data

Cet article présente un cadre d'oubli sélectif hiérarchique à double stratégie qui, en combinant des mises à jour de gradient géométriquement contraintes et des interventions au niveau des tokens, permet d'effacer efficacement des connaissances médicales spécifiques tout en préservant les compétences fondamentales et la confidentialité des données sensibles.

Yi Zhang, Chao Zhang, Zijian Li, Tianxiang Xu, Kunyu Zhang, Zhan Gao, Meinuo Li, Xiaohan Zhang, Qichao Qi, Bing ChenThu, 12 Ma🤖 cs.LG

Burn-After-Use for Preventing Data Leakage through a Secure Multi-Tenant Architecture in Enterprise LLM

Cette étude propose une architecture multi-locataire sécurisée combinée à un mécanisme « Burn-After-Use » pour prévenir les fuites de données dans les environnements d'LLM d'entreprise en assurant l'isolation stricte des instances et la destruction automatique des contextes éphémères après utilisation.

Qiang Zhang, Elena Emma Wang, Jiaming Li, Xichun WangThu, 12 Ma🤖 cs.AI

Beyond Max Tokens: Stealthy Resource Amplification via Tool Calling Chains in LLM Agents

Cet article présente une attaque de déni de service économique furtive et multi-tours contre les agents LLM, exploitant le protocole MCP pour déclencher des chaînes d'appels d'outils excessivement longues via des modifications textuelles optimisées par recherche arborescente, augmentant ainsi considérablement les coûts et la consommation de ressources tout en contournant les filtres de sécurité traditionnels.

Kaiyu Zhou, Yongsen Zheng, Yicheng He, Meng Xue, Xueluan Gong, Yuji Wang, Xuanye Zhang, Kwok-Yan LamThu, 12 Ma🤖 cs.AI

Adversarial Hubness Detector: Detecting Hubness Poisoning in Retrieval-Augmented Generation Systems

Ce papier présente Hubscan, un scanner de sécurité open-source conçu pour détecter le « hubness poisoning » dans les systèmes de génération augmentée par récupération (RAG) en utilisant une architecture multi-détecteurs pour identifier les vecteurs malveillants qui faussent les résultats de recherche.

Idan Habler, Vineeth Sai Narajala, Stav Koren, Amy Chang, Tiffany SaadeThu, 12 Ma🤖 cs.AI

Defensive Refusal Bias: How Safety Alignment Fails Cyber Defenders

Cette étude révèle que l'alignement de sécurité des grands modèles de langage entraîne un « biais de refus défensif », les amenant à rejeter injustement des requêtes légitimes de cybersécurité contenant des mots-clés sensibles, un problème aggravé par les justifications d'autorisation et particulièrement critique pour les agents de défense autonomes.

David Campbell, Neil Kale, Udari Madhushani Sehwag, Bert Herring, Nick Price, Dan Borges, Alex Levinson, Christina Q KnightThu, 12 Ma🤖 cs.AI

Kraken: Higher-order EM Side-Channel Attacks on DNNs in Near and Far Field

Ce papier présente Kraken, la première attaque par canal auxiliaire EM de haut niveau capable d'extraire les paramètres des cœurs Tensor des GPU via une analyse de corrélation de puissance en champ proche, tout en démontrant la fuite d'informations des LLMs à travers des obstacles jusqu'à 100 cm en champ lointain.

Peter Horvath, Ilia Shumailov, Lukasz Chmielewski, Lejla Batina, Yuval YaromThu, 12 Ma💻 cs

There Are No Silly Questions: Evaluation of Offline LLM Capabilities from a Turkish Perspective

Cette étude évalue la robustesse et la sécurité pédagogique des grands modèles de langage hors ligne pour l'enseignement de la langue turque, révélant que les modèles orientés vers le raisonnement de 8 à 14 milliards de paramètres offrent le meilleur compromis entre coût et sécurité, indépendamment de l'échelle du modèle.

Edibe Yilmaz, Kahraman KostasThu, 12 Ma💬 cs.CL

Evaluating Generalization Mechanisms in Autonomous Cyber Attack Agents

Cette étude évalue la capacité de généralisation d'agents cyberattaquants autonomes face à des réaffectations d'adresses IP inattendues, révélant que bien que les agents basés sur les grands modèles de langage obtiennent les meilleurs résultats sur des scénarios non vus, ils le font au prix d'une complexité computationnelle accrue et de défaillances pratiques telles que des boucles d'actions invalides.

Ondřej Lukáš, Jihoon Shin, Emilia Rivas, Diego Forni, Maria Rigaki, Carlos Catania, Aritran Piplai, Christopher Kiekintveld, Sebastian GarciaThu, 12 Ma💻 cs

Targeted Bit-Flip Attacks on LLM-Based Agents

Ce papier présente Flip-Agent, le premier cadre d'attaque par inversion de bits ciblant les agents basés sur les LLM, démontrant que ces vulnérabilités matérielles peuvent être exploitées pour manipuler à la fois les réponses finales et les appels d'outils dans des pipelines complexes.

Jialai Wang, Ya Wen, Zhongmou Liu, Yuxiao Wu, Bingyi He, Zongpeng Li, Ee-Chien ChangThu, 12 Ma🤖 cs.AI

Where Do Flow Semantics Reside? A Protocol-Native Tabular Pretraining Paradigm for Encrypted Traffic Classification

Ce papier propose FlowSem-MAE, une approche de préentraînement tabulaire native aux protocoles qui, en exploitant les unités sémantiques de flux et en corrigeant les biais inductifs des méthodes séquentielles existantes, surpasse l'état de l'art pour la classification du trafic chiffré avec seulement la moitié des données étiquetées.

Sizhe Huang, Shujie YangThu, 12 Ma🤖 cs.AI

OAuthHub: Mitigating OAuth Data Overaccess through a Local Data Hub

Le papier présente OAuthHub, un cadre de développement qui utilise les appareils personnels des utilisateurs comme intermédiaires pour contrôler l'accès aux données OAuth, permettant ainsi aux applications tierces de limiter leur accès aux données aux moments strictement nécessaires tout en réduisant la complexité du code et les temps de développement.

Qiyu Li, Yuhe Tian, Haojian JinThu, 12 Ma💻 cs

SBOMs into Agentic AIBOMs: Schema Extensions, Agentic Orchestration, and Reproducibility Evaluation

Cet article présente les AIBOMs, une extension dynamique des SBOMs basée sur une architecture multi-agents autonomes qui enrichit la traçabilité des chaînes d'approvisionnement logicielles en capturant le comportement d'exécution, la dérive environnementale et le contexte d'exploitabilité pour améliorer la reproductibilité et l'évaluation des vulnérabilités.

Petar Radanliev, Carsten Maple, Omar Santos, Kayvan AtefiThu, 12 Ma🤖 cs.AI

Tool Receipts, Not Zero-Knowledge Proofs: Practical Hallucination Detection for AI Agents

Le papier propose NabaOS, un cadre de vérification léger inspiré de l'épistémologie indienne qui utilise des reçus de signature HMAC pour détecter les hallucinations des agents IA en temps réel avec une faible latence, offrant un compromis coût-efficacité supérieur aux preuves à connaissance nulle.

Abhinaba BasuThu, 12 Ma🤖 cs.AI

Building Privacy-and-Security-Focused Federated Learning Infrastructure for Global Multi-Centre Healthcare Research

Cet article présente FLA³, une plateforme d'apprentissage fédéré intégrant des mécanismes de gouvernance stricts (authentification, autorisation et comptabilité) pour permettre des recherches cliniques collaboratives transfrontalières tout en garantissant la confidentialité des données et la conformité réglementaire.

Fan Zhang, Daniel Kreuter, Javier Fernandez-Marques, BloodCounts Consortium, Gregory Verghese, Bernard Butler, Nicholas Lane, Suthesh Sivapalaratnam, Joseph Taylor, Norbert C. J. de Wit, Nicholas S. Gleadall, Carola-Bibiane Schönlieb, Michael RobertsThu, 12 Ma💻 cs

ADVERSA: Measuring Multi-Turn Guardrail Degradation and Judge Reliability in Large Language Models

L'article présente ADVERSA, un cadre de test automatisé qui évalue la dégradation progressive des garde-fous des grands modèles de langage lors d'interactions adversariales multi-tours, révélant que les jailbreaks réussis se concentrent principalement dans les premiers tours de conversation.

Harry Owiredu-AshleyThu, 12 Ma🤖 cs.AI

Why LLMs Fail: A Failure Analysis and Partial Success Measurement for Automated Security Patch Generation

Cette étude analyse les échecs des modèles de langage dans la génération de correctifs de sécurité pour 64 vulnérabilités Java, révélant que bien que ces modèles préservent souvent la fonctionnalité, ils échouent majoritairement à résoudre les problèmes de sécurité en raison d'incompréhensions sémantiques, ce qui justifie la nécessité d'une validation rigoureuse avant déploiement.

Amir Al-MaamariThu, 12 Ma🤖 cs.AI

TASER: Task-Aware Spectral Energy Refine for Backdoor Suppression in UAV Swarms Decentralized Federated Learning

Le papier propose TASER, un cadre de défense décentralisé innovant pour les essaims de drones utilisant l'apprentissage fédéré, qui supprime les attaques par porte dérobée en exploitant la concentration spectrale des gradients pour préserver les coefficients de fréquence pertinents pour la tâche principale tout en éliminant les composantes malveillantes.

Sizhe Huang, Shujie YangThu, 12 Ma🤖 cs.AI

Amnesia: Adversarial Semantic Layer Specific Activation Steering in Large Language Models

L'article présente Amnesia, une attaque légère par déviation d'activation dans l'espace des représentations qui permet de contourner les mécanismes de sécurité des grands modèles de langage à poids ouverts pour générer du contenu nuisible sans nécessiter de réentraînement.

Ali Raza, Gurang Gupta, Nikolay Matyunin, Jibesh PatraThu, 12 Ma🤖 cs.AI

Multi-Stream Perturbation Attack: Breaking Safety Alignment of Thinking LLMs Through Concurrent Task Interference

Cet article propose une attaque par perturbation multi-flux qui exploite les vulnérabilités du mode de réflexion des grands modèles de langage en intercalant plusieurs tâches pour contourner leurs mécanismes de sécurité et provoquer l'effondrement de leur processus de raisonnement.

Fan YangThu, 12 Ma🤖 cs.AI

← Précédent Suivant →