cs.CR artigos | Gist.Science

AttriGuard: Defeating Indirect Prompt Injection in LLM Agents via Causal Attribution of Tool Invocations

O artigo apresenta o AttriGuard, uma defesa de runtime para agentes de LLM que combate a injeção indireta de prompts ao utilizar atribuição causal baseada em testes contrafactuais para distinguir chamadas de ferramentas motivadas pela intenção do usuário daquelas induzidas por observações não confiáveis, alcançando uma taxa de sucesso de ataque de 0% com perda mínima de utilidade.

Yu He, Haozhe Zhu, Yiming Li, Shuo Shao, Hongwei Yao, Zhihao Liu, Zhan QinThu, 12 Ma💻 cs

A PUF-Based Approach for Copy Protection of Intellectual Property in Neural Network Models

O artigo apresenta uma abordagem baseada em Funções de Hardware Inimitáveis (PUFs) para vincular os pesos de modelos de Redes Neurais às propriedades únicas do hardware subjacente, impedindo assim a execução precisa desses modelos em hardware clonado e protegendo a Propriedade Intelectual incorporada.

Daniel Dorfmeister, Flavio Ferrarotti, Bernhard Fischer, Martin Schwandtner, Hannes SochorThu, 12 Ma🤖 cs.LG

Incremental Federated Learning for Intrusion Detection in IoT Networks under Evolving Threat Landscape

Este estudo analisa o desempenho de modelos de aprendizado incremental federado com LSTMs para detecção de intrusão em redes IoT sob cenários de ameaças em evolução, demonstrando que abordagens de aprendizado cumulativo e representativo oferecem maior estabilidade contra o desvio de conceito, enquanto métodos baseados em retenção equilibram bem precisão e latência.

Muaan Ur Rehman, Hayretdin Bahs, Rajesh KalakotiThu, 12 Ma💻 cs

Re-Evaluating EVMBench: Are AI Agents Ready for Smart Contract Security?

Este artigo reavalia o benchmark EVMbench, demonstrando que, devido a limitações metodológicas como contaminação de dados e falta de controle de scaffolding, os agentes de IA atuais não são estáveis nem capazes de exploração completa em incidentes reais, indicando que a auditoria automatizada total ainda não é viável e que a colaboração humano-IA permanece essencial.

Chaoyuan Peng, Lei Wu, Yajin ZhouThu, 12 Ma💻 cs

Backdoor Directions in Vision Transformers

Este artigo investiga como ataques de backdoor são representados em Vision Transformers, identificando uma "direção de gatilho" causal nas ativações do modelo que permite rastrear o processamento de diferentes tipos de gatilhos, analisar sua relação com ataques adversariais e propor um esquema de detecção baseado em pesos para gatilhos sigilosos.

Sengim Karayalcin, Marina Krcek, Pin-Yu Chen, Stjepan PicekThu, 12 Ma💻 cs

MAD: Memory Allocation meets Software Diversity

O artigo apresenta o MAD, uma abordagem inovadora que combina alocação de memória com princípios de diversidade de software para mitigar vulnerabilidades de erros em DRAM e ataques RowHammer, oferecendo uma defesa eficaz, de fácil implementação e com impacto de desempenho negligenciável.

Manuel Wiesinger, Daniel Dorfmeister, Stefan BrunthalerThu, 12 Ma💻 cs

TOSSS: a CVE-based Software Security Benchmark for Large Language Models

O artigo apresenta o TOSSS, um novo benchmark baseado no banco de dados CVE que avalia a capacidade de Grandes Modelos de Linguagem (LLMs) de distinguir entre trechos de código seguros e vulneráveis, atribuindo uma pontuação de segurança que varia de 0 a 1.

Marc Damie, Murat Bilgehan Ertan, Domenico Essoussi, Angela Makhanu, Gaëtan Peter, Roos WensveenThu, 12 Ma🤖 cs.LG

Layered Performance Analysis of TLS 1.3 Handshakes: Classical, Hybrid, and Pure Post-Quantum Key Exchange

Este estudo de laboratório analisa o impacto dos algoritmos de criptografia pós-quântica (pura e híbrida) em comparação com os tradicionais em todas as camadas de transações HTTP sobre TLS 1.3, utilizando testes de carga para avaliar o desempenho em diferentes tamanhos de resposta.

David Gómez-Cambronero, Daniel Munteanu, Ana Isabel González-TablasThu, 12 Ma💻 cs

Separating Oblivious and Adaptive Differential Privacy under Continual Observation

Este trabalho resolve uma questão em aberto demonstrando a primeira separação explícita entre os cenários de privacidade diferencial "oblivious" e "adaptativo" na observação contínua, apresentando um algoritmo preciso para o primeiro caso que falha drasticamente no segundo após apenas um número constante de passos de tempo.

Mark Bun, Marco Gaboardi, Connor WagamanThu, 12 Ma💻 cs

Adversarial Robustness of Partitioned Quantum Classifiers

Este artigo investiga a robustez adversarial de classificadores quânticos particionados, demonstrando que perturbações direcionadas a técnicas de divisão de circuitos ou teletransporte equivalem à implementação de portas adversariais em camadas intermediárias, analisando esse fenômeno tanto teoricamente quanto experimentalmente.

Pouya Kananian, Hans-Arno JacobsenMon, 09 Ma⚛️ quant-ph

HVAC-EAR: Eavesdropping Human Speech Using HVAC Systems

O artigo apresenta o HVAC-EAR, um sistema que reconstrói fala inteligível a partir de dados de pressão de baixa resolução de sistemas de HVAC, demonstrando pela primeira vez em cenários reais que essa tecnologia pode comprometer a privacidade até 1,2 metro de distância.

Tarikul Islam Tamiti, Biraj Joshi, Rida Hasan, Anomadarshi BaruaMon, 09 Ma💻 cs

SPARK: Jailbreaking T2V Models by Synergistically Prompting Auditory and Recontextualized Knowledge

O artigo apresenta o SPARK, um framework de jailbreak para modelos de texto-para-vídeo que contorna as barreiras de segurança combinando âncoras de cena neutras, gatilhos auditivos latentes e moduladores estilísticos para induzir a geração de vídeos semanticamente inseguros de forma imperceptível.

Zonghao Ying, Moyang Chen, Nizhang Li, Zhiqiang Wang, Wenxin Zhang, Quanchen Zou, Zonglei Jing, Aishan Liu, Xianglong LiuMon, 09 Ma💻 cs

Agent Tools Orchestration Leaks More: Dataset, Benchmark, and Mitigation

Este trabalho apresenta o primeiro estudo sistemático sobre o Risco de Privacidade na Orquestração de Ferramentas (TOP-R) em agentes autônomos, propondo um novo benchmark, identificando causas raízes de vazamento de dados e validando estratégias de mitigação que melhoram significativamente o equilíbrio entre utilidade e segurança.

Yuxuan Qiao, Dongqin Liu, Hongchang Yang, Wei Zhou, Songlin HuMon, 09 Ma🤖 cs.AI

Window-based Membership Inference Attacks Against Fine-tuned Large Language Models

Este artigo apresenta o WBC (Window-Based Comparison), um novo método de ataque de inferência de associação que supera as abordagens globais ao utilizar janelas deslizantes para capturar sinais localizados de memorização em modelos de linguagem grandes, demonstrando superioridade significativa em precisão e taxas de detecção em diversos conjuntos de dados.

Yuetian Chen, Yuntao Du, Kaiyuan Zhang, Ashish Kundu, Charles Fleming, Bruno Ribeiro, Ninghui LiMon, 09 Ma🤖 cs.AI

Peak + Accumulation: A Proxy-Level Scoring Formula for Multi-Turn LLM Attack Detection

Este artigo propõe uma fórmula de pontuação "Pico + Acumulação" para detectar ataques de injeção de prompts em múltiplas voltas em proxies de LLM sem invocar modelos de linguagem, superando as limitações da média ponderada e alcançando 90,8% de recall com uma taxa de falsos positivos de apenas 1,20% em um conjunto de dados de mais de 10.000 conversas.

J Alex CorllMon, 09 Ma🤖 cs.AI

Scrambler: Mixed Boolean Arithmetic Obfuscation Tool Using E-graph and Equality Expansion

O artigo apresenta o Scrambler, uma ferramenta de ofuscação baseada em e-graphs que utiliza Expansão de Igualdade para gerar expressões de Aritmética Booleana Mista (MBA) complexas e diversas com equivalência garantida, demonstrando superioridade em expressividade e complexidade em comparação com ferramentas existentes.

Seoksu Lee, Sangjun An, Eun-Sun ChoMon, 09 Ma💻 cs

Traversal-as-Policy: Log-Distilled Gated Behavior Trees as Externalized, Verifiable Policies for Safe, Robust, and Efficient Agents

O artigo propõe o "Traversal-as-Policy", um método que distila logs de execução em Árvores de Comportamento Portãoizadas (GBTs) executáveis para substituir a geração livre de LLMs por uma política de controle verificável e segura, demonstrando melhorias significativas em taxas de sucesso, redução de violações e eficiência de custos em benchmarks como SWE-bench Verified e WebArena.

Peiran Li, Jiashuo Sun, Fangzhou Lin, Shuo Xing, Tianfu Fu, Suofei Feng, Chaoqun Ni, Zhengzhong TuMon, 09 Ma🤖 cs.AI

Information-Theoretic Privacy Control for Sequential Multi-Agent LLM Systems

Este trabalho propõe um framework de treinamento regularizado por privacidade que aborda o vazamento de informações composicional em sistemas sequenciais de agentes LLM, demonstrando que a privacidade nesses ambientes deve ser tratada como uma propriedade sistêmica e não apenas através de restrições locais.

Sadia Asif, Mohammad Mohammadi AmiriMon, 09 Ma🤖 cs.LG

Ecosystem Trust Profiles

Este artigo propõe o conceito de "perfis de confiança de ecossistema" para permitir que ecossistemas digitais e espaços de dados definam autonomamente credenciais confiáveis, demonstrando como a interoperabilidade e a resolução do dilema de confiança cruzada dependem diretamente da governança coordenada e da sobreposição desses perfis.

Christoph F. StrnadlMon, 09 Ma💻 cs

Privacy-Preserving Collaborative Medical Image Segmentation Using Latent Transform Networks

Este artigo apresenta o PPCMI-SF, um framework colaborativo de segmentação de imagens médicas que preserva a privacidade ao utilizar transformações latentes criptografadas para permitir treinamento multi-institucional com alta precisão e resistência a ataques, sem a necessidade de compartilhar dados brutos.

Saheed Ademola Bello, Muhammad Shahid Jabbar, Muhammad Sohail Ibrahim, Shujaat KhanMon, 09 Ma💻 cs

← Anterior Próximo →