cs.CR articoli | Gist.Science

Unclonable Encryption in the Haar Random Oracle Model

Questo lavoro presenta la prima costruzione di crittografia incloneabile riutilizzabile nel modello dell'oracolo casuale di Haar, dimostrando l'esistenza di tale primitiva anche in assenza di funzioni a senso unico e introducendo un nuovo lemma di riprogrammazione unitaria come contributo tecnico centrale.

James Bartusek, Eli GoldinFri, 13 Ma⚛️ quant-ph

KEPo: Knowledge Evolution Poison on Graph-based Retrieval-Augmented Generation

Il paper introduce KEPo, un nuovo metodo di avvelenamento progettato specificamente per aggirare le difese dei sistemi GraphRAG manipolando l'evoluzione della conoscenza all'interno del grafo per indurre i modelli linguistici a generare risposte dannose.

Qizhi Chen, Chao Qi, Yihong Huang, Muquan Li, Rongzheng Wang, Dongyang Zhang, Ke Qin, Shuang LiangFri, 13 Ma🤖 cs.LG

Strict Optimality of Frequency Estimation Under Local Differential Privacy

Questo articolo stabilisce l'ottimalità rigorosa nella precisione della stima delle frequenze sotto la privacy differenziale locale, dimostrando che un stimatore con configurazione simmetrica ed estrema e una dimensione di supporto costante ottimizzata raggiunge la massima precisione con costi di comunicazione minimi, e propone un algoritmo pratico basato su una versione modificata dello Count-Mean Sketch che risulta indistinguibile dall'ottimalità teorica.

Mingen PanFri, 13 Ma🔢 math

Taming OpenClaw: Security Analysis and Mitigation of Autonomous LLM Agent Threats

Questo articolo presenta un'analisi completa delle minacce di sicurezza per l'agente autonomo OpenClaw, introducendo un framework a cinque livelli per esaminare vulnerabilità come l'iniezione di prompt indiretta e l'avvelenamento della memoria, e proponendo strategie di difesa olistiche per mitigare i rischi sistemici lungo l'intero ciclo di vita dell'agente.

Xinhao Deng, Yixiang Zhang, Jiaqing Wu, Jiaqi Bai, Sibo Yi, Zhuoheng Zou, Yue Xiao, Rennai Qiu, Jianan Ma, Jialuo Chen, Xiaohu Du, Xiaofang Yang, Shiwen Cui, Changhua Meng, Weiqiang Wang, Jiaxing Song, Ke Xu, Qi LiFri, 13 Ma🤖 cs.AI

Exponential-Family Membership Inference: From LiRA and RMIA to BaVarIA

Il paper unifica gli attacchi di inferenza sulla appartenenza LiRA, RMIA e BASE in un unico quadro basato sui log-verosimiglianze delle famiglie esponenziali, introducendo BaVarIA, un metodo bayesiano che stima la varianza per migliorare le prestazioni, specialmente in scenari con risorse limitate.

Rickard BrännvallFri, 13 Ma🤖 cs.LG

You Told Me to Do It: Measuring Instructional Text-induced Private Data Leakage in LLM Agents

Il paper identifica e quantifica una vulnerabilità strutturale negli agenti LLM ad alto privilegio, denominata "Trusted Executor Dilemma", che permette la fuoriuscita di dati privati tramite l'esecuzione acritica di istruzioni malevole nascoste nella documentazione, rivelando un persistente divario tra la conformità funzionale e la sicurezza che le attuali difese non riescono a mitigare.

Ching-Yu Kao, Xinfeng Li, Shenyu Dai, Tianze Qiu, Pengcheng Zhou, Eric Hanchen Jiang, Philip SperlFri, 13 Ma🤖 cs.AI

The Mirror Design Pattern: Strict Data Geometry over Model Scale for Prompt Injection Detection

Il paper introduce "Mirror", un pattern di progettazione basato su una rigorosa geometria dei dati che, utilizzando un corpus curato e un classificatore lineare leggero, supera le prestazioni dei grandi modelli neurali nel rilevamento delle iniezioni di prompt, offrendo una soluzione più rapida, deterministica e auditabile per il primo livello di difesa.

J Alex CorllFri, 13 Ma🤖 cs.AI

On the Possible Detectability of Image-in-Image Steganography

Questo studio dimostra che gli schemi di steganografia "immagine-in-immagine" sono facilmente rilevabili attraverso l'analisi delle componenti indipendenti e i primi quattro momenti statistici, raggiungendo un'accuratezza fino al 99% e superando i metodi di steganalisi classici.

Antoine Mallet (CRIStAL), Patrick Bas (CRIStAL)Fri, 13 Ma⚡ eess

Understanding LLM Behavior When Encountering User-Supplied Harmful Content in Harmless Tasks

Questo studio rivela che i principali modelli linguistici, inclusi i più recenti, spesso falliscono nel rifiutare contenuti dannosi forniti dagli utenti anche durante l'esecuzione di compiti apparentemente innocui, evidenziando una vulnerabilità etica a livello di contenuto che richiede nuove misure di sicurezza.

Junjie Chu, Yiting Qu, Ye Leng, Michael Backes, Yun Shen, Savvas Zannettou, Yang ZhangFri, 13 Ma🤖 cs.AI

Delayed Backdoor Attacks: Exploring the Temporal Dimension as a New Attack Surface in Pre-Trained Models

Questo lavoro introduce gli Attacchi Backdoor Ritardati (DBA), una nuova minaccia per i modelli pre-addestrati che sfrutta la dimensione temporale per attivare comportamenti malevoli in modo differito tramite trigger banali, dimostrando la fattibilità di tale approccio attraverso il prototipo DND che supera le difese esistenti mantenendo alta l'accuratezza.

Zikang Ding, Haomiao Yang, Meng Hao, Wenbo Jiang, Kunlan Xiang, Runmeng Du, Yijing Liu, Ruichen Zhang, Dusit NiyatoFri, 13 Ma🤖 cs.AI

HomeSafe-Bench: Evaluating Vision-Language Models on Unsafe Action Detection for Embodied Agents in Household Scenarios

Il paper introduce HomeSafe-Bench, un benchmark per valutare la capacità dei modelli visione-linguaggio di rilevare azioni pericolose in ambienti domestici, e propone HD-Guard, un'architettura gerarchica che bilancia efficienza e accuratezza nel monitoraggio della sicurezza in tempo reale.

Jiayue Pu, Zhongxiang Sun, Zilu Zhang, Xiao Zhang, Jun XuFri, 13 Ma🤖 cs.AI

Cascade: Composing Software-Hardware Attack Gadgets for Adversarial Threat Amplification in Compound AI Systems

Questo lavoro dimostra come le vulnerabilità tradizionali del software e dell'hardware possano essere combinate con attacchi algoritmici specifici per i modelli linguistici per compromettere l'integrità e la riservatezza dei sistemi di intelligenza artificiale composti, evidenziando la necessità di integrare tali minacce nei processi di valutazione della sicurezza.

Sarbartha Banerjee, Prateek Sahu, Anjo Vahldiek-Oberwagner, Jose Sanchez Vicarte, Mohit TiwariFri, 13 Ma🤖 cs.AI

Understanding Disclosure Risk in Differential Privacy with Applications to Noise Calibration and Auditing (Extended Version)

Questo lavoro introduce il "reconstruction advantage" come metrica unificata per valutare il rischio di divulgazione nella privacy differenziale, superando i limiti delle analisi esistenti e abilitando una calibrazione del rumore e un'audit più precisi ed efficaci.

Patricia Guerra-Balboa, Annika Sauer, Héber H. Arcolezi, Thorsten StrufeFri, 13 Ma🔢 math

Security Considerations for Artificial Intelligence Agents

Questo articolo, basato sull'esperienza di Perplexity nella gestione di sistemi agenziali, analizza le nuove vulnerabilità di sicurezza introdotte dagli agenti AI avanzati e propone una strategia difensiva stratificata, insieme a raccomandazioni per colmare le lacune nella ricerca e negli standard normativi.

Ninghui Li, Kaiyuan Zhang, Kyle Polley, Jerry MaFri, 13 Ma🤖 cs.LG

STAMP: Selective Task-Aware Mechanism for Text Privacy

Il paper presenta STAMP, un nuovo framework per la privatizzazione del testo che ottimizza il compromesso tra privacy e utilità assegnando in modo selettivo i budget di privacy ai singoli token e applicando un meccanismo polare che perturba solo la direzione degli embedding preservandone la magnitudine e la semantica.

Fengwei Tian, Payel Bhattacharjee, Heidi Hanson, Geoffrey D. Rubin, Joseph Y. Lo, Ravi TandonFri, 13 Ma🤖 cs.LG

Detecting LLM-Generated Peer Reviews

Questo lavoro presenta un quadro rigoroso per il rilevamento delle recensioni peer generate da LLM, basato sull'iniezione indiretta di prompt tramite il PDF del paper per inserire un filigrana nascosta, offrendo garanzie statistiche superiori rispetto ai metodi tradizionali come la correzione di Bonferroni e dimostrando efficacia contro le comuni difese dei revisori.

Vishisht Rao, Aounon Kumar, Himabindu Lakkaraju + 1 more2026-03-13🤖 cs.AI

Integer Factorization via Tensor Network Schnorr's Sieving

Questo articolo presenta un algoritmo di fattorizzazione basato su reti tensoriali che applica il metodo di setaccio di Schnorr, dimostrando una scalabilità polinomiale delle risorse fino a numeri RSA di 130 bit e sottolineando l'urgenza di adottare crittografia post-quantistica.

Marco Tesoro, Ilaria Siloi, Daniel Jaschke + 2 more2026-03-12⚛️ quant-ph

PrometheusFree: Concurrent Detection of Laser Fault Injection Attacks in Optical Neural Networks

Il paper presenta PrometheusFree, un framework per reti neurali ottiche che rileva in modo concorrente gli attacchi di iniezione di guasti tramite laser, utilizzando una tecnica innovativa di perturbazione della divisione di lunghezza d'onda (WDP) per migliorare significativamente l'accuratezza del rilevamento e ridurre il tasso di successo degli attacchi.

Kota Nishida, Yoshihiro Midoh, Noriyuki Miura + 3 more2026-03-12🔬 physics.optics

Probabilistic Counters for Privacy Preserving Data Aggregation

Questo articolo dimostra che i contatori probabilistici, come quelli di Morris e MaxGeo, possono garantire la privacy dei dati nell'aggregazione distribuita sfruttando la loro intrinseca randomizzazione senza necessità di aggiunte esterne, fornendo al contempo un'analisi formale rigorosa dei parametri di privacy differenziale.

Dominik Bojko, Krzysztof Grining, Marek Klonowski2026-03-11💻 cs

Automated TEE Adaptation with LLMs: Identifying, Transforming, and Porting Sensitive Functions in Programs

Il paper presenta AUTOTEE, un approccio basato su modelli linguistici di grandi dimensioni (LLM) che automatizza l'identificazione, la trasformazione e il porting di funzioni sensibili in ambienti di esecuzione attendibili (TEE), riducendo la necessità di intervento manuale e ottenendo elevate prestazioni nei linguaggi Java e Python.

Ruidong Han, Zhou Yang, Chengyan Ma, Ye Liu, Yuqing Niu, Siqi Ma, Debin Gao, David Lo2026-03-06🔒 cs.CR

← Precedente Successivo →