cs.CR articoli | Gist.Science

AttriGuard: Defeating Indirect Prompt Injection in LLM Agents via Causal Attribution of Tool Invocations

AttriGuard è un nuovo sistema di difesa per agenti LLM che contrasta l'iniezione indiretta di prompt (IPI) utilizzando l'attribuzione causale e test controfattuali paralleli per verificare se le chiamate agli strumenti sono realmente motivate dall'intento dell'utente e non da osservazioni non attendibili, ottenendo così un tasso di successo degli attacchi nullo con una perdita minima di utilità.

Yu He, Haozhe Zhu, Yiming Li, Shuo Shao, Hongwei Yao, Zhihao Liu, Zhan QinThu, 12 Ma💻 cs

A PUF-Based Approach for Copy Protection of Intellectual Property in Neural Network Models

Il paper propone un metodo per proteggere la proprietà intellettuale nei modelli di reti neurali legando i loro pesi alle caratteristiche hardware uniche tramite Funzioni Fisiche Non Clonabili (PUF), rendendo di fatto impossibile l'esecuzione accurata del modello su hardware clonato.

Daniel Dorfmeister, Flavio Ferrarotti, Bernhard Fischer, Martin Schwandtner, Hannes SochorThu, 12 Ma🤖 cs.LG

Incremental Federated Learning for Intrusion Detection in IoT Networks under Evolving Threat Landscape

Questo studio analizza l'efficacia dell'apprendimento federato incrementale con modelli LSTM per migliorare la resilienza a lungo termine dei sistemi di rilevamento delle intrusioni nelle reti IoT, dimostrando che strategie come l'apprendimento cumulativo e rappresentativo offrono le prestazioni più stabili di fronte al drift concettuale, pur rispettando i vincoli di risorse dei dispositivi.

Muaan Ur Rehman, Hayretdin Bahs, Rajesh KalakotiThu, 12 Ma💻 cs

Re-Evaluating EVMBench: Are AI Agents Ready for Smart Contract Security?

Questo studio ricalibra le aspettative sull'auditing automatizzato dei contratti intelligenti, dimostrando che gli agenti AI, sebbene capaci di rilevare vulnerabilità note, mancano di stabilità e non riescono a sfruttare completamente le falle in scenari reali, evidenziando la necessità di un approccio ibrido uomo-macchina piuttosto che una soluzione completamente autonoma.

Chaoyuan Peng, Lei Wu, Yajin ZhouThu, 12 Ma💻 cs

Backdoor Directions in Vision Transformers

Questo paper indaga come gli attacchi backdoor siano rappresentati nei Vision Transformers, identificando una specifica "direzione del trigger" nelle attivazioni del modello che ne conferma il ruolo causale, permettendo di tracciare l'elaborazione delle caratteristiche malevole, analizzare le differenze tra trigger statici e distribuiti, e proporre un metodo di rilevamento basato sui pesi senza necessità di dati.

Sengim Karayalcin, Marina Krcek, Pin-Yu Chen, Stjepan PicekThu, 12 Ma💻 cs

MAD: Memory Allocation meets Software Diversity

Il paper presenta MAD, un approccio innovativo che combina l'allocazione della memoria con i principi della diversità software per contrastare le vulnerabilità DRAM e gli attacchi RowHammer, offrendo una soluzione agnostica rispetto all'hardware e al software con impatto trascurabile sulle prestazioni.

Manuel Wiesinger, Daniel Dorfmeister, Stefan BrunthalerThu, 12 Ma💻 cs

TOSSS: a CVE-based Software Security Benchmark for Large Language Models

Il paper introduce TOSSS, un nuovo benchmark basato sul database CVE per valutare la capacità dei Large Language Models di selezionare frammenti di codice sicuri rispetto a quelli vulnerabili, fornendo un punteggio di sicurezza complementare alle valutazioni esistenti.

Marc Damie, Murat Bilgehan Ertan, Domenico Essoussi, Angela Makhanu, Gaëtan Peter, Roos WensveenThu, 12 Ma🤖 cs.LG

Layered Performance Analysis of TLS 1.3 Handshakes: Classical, Hybrid, and Pure Post-Quantum Key Exchange

Questo studio presenta un'analisi sperimentale su più livelli dell'impatto degli algoritmi crittografici post-quantum (ibridi e puri) rispetto a quelli tradizionali sulle prestazioni delle transazioni HTTP su TLS 1.3, valutando le prestazioni dalla fase di handshake TCP fino al livello applicativo HTTP.

David Gómez-Cambronero, Daniel Munteanu, Ana Isabel González-TablasThu, 12 Ma💻 cs

Separating Oblivious and Adaptive Differential Privacy under Continual Observation

Questo lavoro risolve una questione aperta dimostrando la prima separazione esplicita tra privacy differenziale in modalità cieca e adattiva nel contesto dell'osservazione continua, presentando un algoritmo accurato per un numero esponenziale di passi temporali nel primo caso e provando che ogni algoritmo adattivo fallisce dopo un numero costante di passi.

Mark Bun, Marco Gaboardi, Connor WagamanThu, 12 Ma💻 cs

Adversarial Robustness of Partitioned Quantum Classifiers

Questo studio esamina la robustezza avversaria dei classificatori quantistici partizionati, dimostrando che le perturbazioni mirate alle tecniche di suddivisione dei circuiti (come il taglio dei fili o la teletrasmissione) sono equivalenti all'implementazione di porte avversarie negli strati intermedi e analizzando tale fenomeno sia teoricamente che sperimentalmente.

Pouya Kananian, Hans-Arno JacobsenMon, 09 Ma⚛️ quant-ph

HVAC-EAR: Eavesdropping Human Speech Using HVAC Systems

Il paper introduce HVAC-EAR, un sistema che ricostruisce la voce umana intelligibile dai dati di pressione dei sistemi HVAC, sfruttando un modello complesso per superare le limitazioni del rumore e della bassa frequenza di campionamento e rivelando nuove preoccupazioni per la privacy fino a 1,2 metri di distanza.

Tarikul Islam Tamiti, Biraj Joshi, Rida Hasan, Anomadarshi BaruaMon, 09 Ma💻 cs

SPARK: Jailbreaking T2V Models by Synergistically Prompting Auditory and Recontextualized Knowledge

Il paper presenta SPARK, un framework di jailbreak che aggira le difese dei modelli testo-video sfruttando prompt apparentemente innocui che combinano ancoraggi di scena neutri, trigger auditivi latenti e modulatori stilistici per indurre la generazione di contenuti non sicuri mantenendo l'intento originale.

Zonghao Ying, Moyang Chen, Nizhang Li, Zhiqiang Wang, Wenxin Zhang, Quanchen Zou, Zonglei Jing, Aishan Liu, Xianglong LiuMon, 09 Ma💻 cs

Agent Tools Orchestration Leaks More: Dataset, Benchmark, and Mitigation

Questo studio introduce il rischio di privacy nell'orchestrazione degli strumenti (TOP-R), un nuovo pericolo in cui gli agenti autonomi sintetizzano informazioni sensibili da frammenti non sensibili, presentando un framework formale, un benchmark (TOP-Bench) e strategie di mitigazione che migliorano significativamente il compromesso tra utilità e sicurezza.

Yuxuan Qiao, Dongqin Liu, Hongchang Yang, Wei Zhou, Songlin HuMon, 09 Ma🤖 cs.AI

Window-based Membership Inference Attacks Against Fine-tuned Large Language Models

Il paper introduce WBC, un nuovo metodo di attacco per l'inferenza di appartenenza che supera i limiti delle tecniche globali analizzando segnali localizzati tramite finestre scorrevoli, dimostrando così una maggiore efficacia nel rilevare i dati di addestramento memorizzati nei modelli linguistici su larga scala.

Yuetian Chen, Yuntao Du, Kaiyuan Zhang, Ashish Kundu, Charles Fleming, Bruno Ribeiro, Ninghui LiMon, 09 Ma🤖 cs.AI

Peak + Accumulation: A Proxy-Level Scoring Formula for Multi-Turn LLM Attack Detection

Il paper propone una formula di scoring "Peak + Accumulation" a livello di proxy, priva di LLM, per rilevare attacchi di iniezione di prompt multi-turno aggregando il rischio singolo, la persistenza e la diversità delle categorie, ottenendo un'accuratezza del 90,8% su un dataset di oltre 10.000 conversazioni.

J Alex CorllMon, 09 Ma🤖 cs.AI

Scrambler: Mixed Boolean Arithmetic Obfuscation Tool Using E-graph and Equality Expansion

Il paper presenta Scrambler, uno strumento di offuscamento basato su e-graph e sull'espansione delle uguaglianze che genera in modo efficiente espressioni Mixed Boolean Arithmetic complesse e diversificate garantendo l'equivalenza per costruzione.

Seoksu Lee, Sangjun An, Eun-Sun ChoMon, 09 Ma💻 cs

Traversal-as-Policy: Log-Distilled Gated Behavior Trees as Externalized, Verifiable Policies for Safe, Robust, and Efficient Agents

Il paper propone "Traversal-as-Policy", un metodo che distilla i log di esecuzione in un Gated Behavior Tree eseguibile per trasformare la navigazione dell'albero in una politica di controllo verificabile, migliorando significativamente il successo, la sicurezza e l'efficienza degli agenti LLM autonomi su benchmark complessi.

Peiran Li, Jiashuo Sun, Fangzhou Lin, Shuo Xing, Tianfu Fu, Suofei Feng, Chaoqun Ni, Zhengzhong TuMon, 09 Ma🤖 cs.AI

Information-Theoretic Privacy Control for Sequential Multi-Agent LLM Systems

Questo lavoro propone un framework di addestramento regolarizzato per la privacy che affronta la perdita di informazioni compositiva nei sistemi sequenziali multi-agente LLM, dimostrando che la protezione dei dati richiede un controllo a livello di sistema piuttosto che vincoli locali isolati.

Sadia Asif, Mohammad Mohammadi AmiriMon, 09 Ma🤖 cs.LG

Ecosystem Trust Profiles

Il paper definisce i "profili di fiducia dell'ecosistema" come un metodo per permettere a ecosistemi digitali e spazi dati autonomi di pubblicare le credenziali affidabili, dimostrando come l'interoperabilità tra di essi dipenda strettamente dalla loro sovrapposizione di fiducia e proponendo soluzioni per bilanciare la sovranità con la stabilità della fiducia cross-ecosistema.

Christoph F. StrnadlMon, 09 Ma💻 cs

Privacy-Preserving Collaborative Medical Image Segmentation Using Latent Transform Networks

Questo lavoro presenta il PPCMI-SF, un framework collaborativo che garantisce la privacy nella segmentazione di immagini mediche attraverso trasformazioni latenti crittografate, ottenendo risultati accurati e sicuri senza condividere dati grezzi tra istituzioni.

Saheed Ademola Bello, Muhammad Shahid Jabbar, Muhammad Sohail Ibrahim, Shujaat KhanMon, 09 Ma💻 cs

← Precedente Successivo →