cs.CR articoli | Gist.Science

Shadow in the Cache: Unveiling and Mitigating Privacy Risks of KV-cache in LLM Inference

Questo articolo analizza per la prima volta i rischi di privacy legati alla cache KV nell'inferenza dei grandi modelli linguistici, dimostrando come sia possibile ricostruire input sensibili e proponendo KV-Cloak, un meccanismo di difesa leggero ed efficiente che neutralizza tali minacce senza compromettere accuratezza o prestazioni.

Zhifan Luo, Shuo Shao, Su Zhang, Lijing Zhou, Yuke Hu, Chenxu Zhao, Zhihao Liu, Zhan QinThu, 12 Ma💬 cs.CL

Hierarchical Dual-Strategy Unlearning for Biomedical and Healthcare Intelligence Using Imperfect and Privacy-Sensitive Medical Data

Questo articolo presenta un framework di disapprendimento gerarchico a doppia strategia che, integrando aggiornamenti del gradiente vincolati geometricamente e interventi a livello di token consapevoli dei concetti, rimuove selettivamente conoscenze mediche specifiche da modelli linguistici preservando le competenze fondamentali e garantendo la privacy con modifiche minime ai parametri.

Yi Zhang, Chao Zhang, Zijian Li, Tianxiang Xu, Kunyu Zhang, Zhan Gao, Meinuo Li, Xiaohan Zhang, Qichao Qi, Bing ChenThu, 12 Ma🤖 cs.LG

Burn-After-Use for Preventing Data Leakage through a Secure Multi-Tenant Architecture in Enterprise LLM

Questo studio presenta un'architettura multi-tenant sicura (SMTA) combinata con un meccanismo "Burn-After-Use" (BAU) per prevenire la fuoriuscita di dati negli ambienti aziendali di LLM, garantendo l'isolamento dei contesti conversazionali e la loro distruzione automatica dopo l'uso, come dimostrato da valutazioni sperimentali che conferiscono elevate percentuali di successo nella difesa da attacchi di perdita dati.

Qiang Zhang, Elena Emma Wang, Jiaming Li, Xichun WangThu, 12 Ma🤖 cs.AI

Beyond Max Tokens: Stealthy Resource Amplification via Tool Calling Chains in LLM Agents

Il paper presenta un attacco DoS economico e stealth per agenti LLM che, sfruttando il protocollo MCP e l'ottimizzazione MCTS su catene di chiamate agli strumenti, amplifica drasticamente costi e consumo di risorse pur mantenendo l'aspetto benigno del payload finale.

Kaiyu Zhou, Yongsen Zheng, Yicheng He, Meng Xue, Xueluan Gong, Yuji Wang, Xuanye Zhang, Kwok-Yan LamThu, 12 Ma🤖 cs.AI

Adversarial Hubness Detector: Detecting Hubness Poisoning in Retrieval-Augmented Generation Systems

Il paper introduce Hubscan, uno scanner di sicurezza open-source progettato per rilevare il "hubness poisoning" nei sistemi Retrieval-Augmented Generation (RAG) attraverso un'architettura multi-rilevatore che combina analisi statistiche, valutazioni di stabilità e adattabilità a diversi database vettoriali, ottenendo prestazioni elevate nel identificare contenuti dannosi su benchmark e dataset reali.

Idan Habler, Vineeth Sai Narajala, Stav Koren, Amy Chang, Tiffany SaadeThu, 12 Ma🤖 cs.AI

Defensive Refusal Bias: How Safety Alignment Fails Cyber Defenders

Il documento rivela che l'allineamento alla sicurezza dei modelli linguistici di grandi dimensioni genera un "pregiudizio di rifiuto difensivo", portandoli a negare ingiustificatamente assistenza a compiti legittimi di cybersecurity quando questi contengono termini sensibili, un problema che peggiora con le autorizzazioni esplicite e che richiede un approccio basato sull'intento piuttosto che sulla semplice similarità semantica.

David Campbell, Neil Kale, Udari Madhushani Sehwag, Bert Herring, Nick Price, Dan Borges, Alex Levinson, Christina Q KnightThu, 12 Ma🤖 cs.AI

Kraken: Higher-order EM Side-Channel Attacks on DNNs in Near and Far Field

Questo lavoro presenta "Kraken", il primo attacco side-channel fisico che estrae parametri dai Tensor Core delle GPU sia a campo vicino che a campo lontano, dimostrando la vulnerabilità dei modelli di deep learning e dei LLM al furto tramite analisi di correlazione di potenza e fughe elettromagnetiche fino a 100 cm di distanza.

Peter Horvath, Ilia Shumailov, Lukasz Chmielewski, Lejla Batina, Yuval YaromThu, 12 Ma💻 cs

There Are No Silly Questions: Evaluation of Offline LLM Capabilities from a Turkish Perspective

Questo studio valuta la robustezza e la sicurezza pedagogica dei modelli linguistici offline per l'educazione alla lingua turca, rivelando che i modelli orientati al ragionamento nella fascia 8B-14B offrono il miglior compromesso tra costi e sicurezza, mentre la resistenza alle anomalie non dipende esclusivamente dalla scala del modello.

Edibe Yilmaz, Kahraman KostasThu, 12 Ma💬 cs.CL

Evaluating Generalization Mechanisms in Autonomous Cyber Attack Agents

Questo studio valuta la capacità di generalizzazione di agenti di attacco informatico autonomi di fronte a cambiamenti imprevisti negli indirizzi IP, rivelando che, sebbene gli agenti basati su LLM ottenano i migliori risultati di adattamento, lo fanno a scapito di costi computazionali elevati, ridotta trasparenza e nuove vulnerabilità operative.

Ondřej Lukáš, Jihoon Shin, Emilia Rivas, Diego Forni, Maria Rigaki, Carlos Catania, Aritran Piplai, Christopher Kiekintveld, Sebastian GarciaThu, 12 Ma💻 cs

Targeted Bit-Flip Attacks on LLM-Based Agents

Questo lavoro presenta Flip-Agent, il primo framework di attacco bit-flip mirato in grado di manipolare sia gli output finali che le invocazioni di strumenti negli agenti basati su LLM, rivelando nuove e critiche vulnerabilità in questi sistemi.

Jialai Wang, Ya Wen, Zhongmou Liu, Yuxiao Wu, Bingyi He, Zongpeng Li, Ee-Chien ChangThu, 12 Ma🤖 cs.AI

Where Do Flow Semantics Reside? A Protocol-Native Tabular Pretraining Paradigm for Encrypted Traffic Classification

Il paper propone FlowSem-MAE, un paradigma di pre-addestramento tabulare nativo dei protocolli che supera i limiti dei modelli basati su byte sequenziali per la classificazione del traffico cifrato, preservando le semantiche dei campi del protocollo e ottenendo prestazioni superiori con meno dati etichettati.

Sizhe Huang, Shujie YangThu, 12 Ma🤖 cs.AI

OAuthHub: Mitigating OAuth Data Overaccess through a Local Data Hub

Il paper presenta OAuthHub, un framework di sviluppo che utilizza i dispositivi personali degli utenti come intermediari per mitigare l'eccessivo accesso ai dati OAuth, consentendo un controllo granulare delle autorizzazioni e riducendo significativamente il tempo e il codice necessari per gli sviluppatori.

Qiyu Li, Yuhe Tian, Haojian JinThu, 12 Ma💻 cs

SBOMs into Agentic AIBOMs: Schema Extensions, Agentic Orchestration, and Reproducibility Evaluation

Questo articolo introduce gli AIBOM (Artificial Intelligence Bills of Materials) agentici, un'estensione dinamica degli SBOM basata su un'architettura multi-agente che integra monitoraggio del runtime, ricostruzione dell'ambiente e ragionamento sulle vulnerabilità per garantire una provenienza del software riproducibile e contestualizzata.

Petar Radanliev, Carsten Maple, Omar Santos, Kayvan AtefiThu, 12 Ma🤖 cs.AI

Tool Receipts, Not Zero-Knowledge Proofs: Practical Hallucination Detection for AI Agents

Il paper presenta NabaOS, un framework di verifica leggero ispirato all'epistemologia indiana Nyaya Shastra che rileva le allucinazioni degli agenti AI in tempo reale tramite ricevute di esecuzione crittograficamente firmate, offrendo un compromesso superiore tra latenza e copertura rispetto alle prove a conoscenza zero.

Abhinaba BasuThu, 12 Ma🤖 cs.AI

Building Privacy-and-Security-Focused Federated Learning Infrastructure for Global Multi-Centre Healthcare Research

Il paper presenta FLA³, una piattaforma di apprendimento federato che integra meccanismi di autenticazione, autorizzazione e contabilità (AAA) conformi a XACML per garantire la sovranità dei dati e la conformità normativa, dimostrando attraverso studi reali e simulati che tale approccio governativo permette di ottenere prestazioni predittive paragonabili all'addestramento centralizzato nel contesto della ricerca sanitaria globale.

Fan Zhang, Daniel Kreuter, Javier Fernandez-Marques, BloodCounts Consortium, Gregory Verghese, Bernard Butler, Nicholas Lane, Suthesh Sivapalaratnam, Joseph Taylor, Norbert C. J. de Wit, Nicholas S. Gleadall, Carola-Bibiane Schönlieb, Michael RobertsThu, 12 Ma💻 cs

ADVERSA: Measuring Multi-Turn Guardrail Degradation and Judge Reliability in Large Language Models

Il paper introduce ADVERSA, un framework di red-teaming automatizzato che misura il degrado continuo delle difese dei modelli linguistici durante interazioni multi-turno, rivelando che la maggior parte dei jailbreak avviene nelle prime fasi e fornendo una valutazione rigorosa dell'affidabilità dei giudici.

Harry Owiredu-AshleyThu, 12 Ma🤖 cs.AI

Why LLMs Fail: A Failure Analysis and Partial Success Measurement for Automated Security Patch Generation

Questo studio analizza i limiti dei modelli linguistici nella generazione automatica di patch di sicurezza per vulnerabilità Java, rivelando che, sebbene preservino spesso la funzionalità, falliscono prevalentemente nel comprendere la semantica corretta delle riparazioni, ottenendo un basso punteggio di sicurezza che ne richiede una validazione rigorosa prima del dispiegamento.

Amir Al-MaamariThu, 12 Ma🤖 cs.AI

TASER: Task-Aware Spectral Energy Refine for Backdoor Suppression in UAV Swarms Decentralized Federated Learning

Il paper propone TASER, un nuovo framework di difesa decentralizzato per sciami di UAV che sfrutta l'analisi della concentrazione spettrale dei gradienti per sopprimere efficacemente attacchi backdoor stealthy, superando i limiti dei metodi basati sul rilevamento degli outlier.

Sizhe Huang, Shujie YangThu, 12 Ma🤖 cs.AI

Amnesia: Adversarial Semantic Layer Specific Activation Steering in Large Language Models

Il documento presenta "Amnesia", un attacco avversario leggero che manipola gli stati interni dei transformer per aggirare i meccanismi di sicurezza dei modelli linguistici open-weight, permettendo loro di generare contenuti dannosi senza necessità di ulteriore addestramento.

Ali Raza, Gurang Gupta, Nikolay Matyunin, Jibesh PatraThu, 12 Ma🤖 cs.AI

Multi-Stream Perturbation Attack: Breaking Safety Alignment of Thinking LLMs Through Concurrent Task Interference

Questo paper propone un attacco di perturbazione multi-stream che sfrutta l'interferenza tra compiti concorrenti per compromettere l'allineamento alla sicurezza dei modelli LLM in modalità "pensante", causando il collasso del processo di ragionamento e ottenendo tassi di successo elevati nelle evasioni di sicurezza.

Fan YangThu, 12 Ma🤖 cs.AI

← Precedente Successivo →