cs.CR artículos | Gist.Science

AttriGuard: Defeating Indirect Prompt Injection in LLM Agents via Causal Attribution of Tool Invocations

El artículo presenta AttriGuard, un nuevo mecanismo de defensa en tiempo real para agentes LLM que utiliza atribución causal y pruebas contrafactuales para distinguir y bloquear inyecciones de prompts indirectas en las invocaciones de herramientas, logrando una tasa de éxito de ataque del 0% con una pérdida de utilidad mínima.

Yu He, Haozhe Zhu, Yiming Li, Shuo Shao, Hongwei Yao, Zhihao Liu, Zhan QinThu, 12 Ma💻 cs

A PUF-Based Approach for Copy Protection of Intellectual Property in Neural Network Models

El artículo presenta un método basado en Funciones Físicas No Clonables (PUF) para vincular los pesos de los modelos de redes neuronales a su hardware subyacente, impidiendo así la ejecución precisa de estos modelos en hardware clonado y protegiendo la propiedad intelectual.

Daniel Dorfmeister, Flavio Ferrarotti, Bernhard Fischer, Martin Schwandtner, Hannes SochorThu, 12 Ma🤖 cs.LG

Incremental Federated Learning for Intrusion Detection in IoT Networks under Evolving Threat Landscape

Este estudio propone un enfoque de aprendizaje federado incremental basado en LSTM para mejorar la detección de intrusiones en redes IoT bajo un panorama de amenazas en evolución, demostrando que las estrategias de aprendizaje acumulativo y representativo ofrecen el mejor rendimiento estable frente al cambio de concepto, mientras que los métodos basados en retención equilibran eficazmente la precisión y la latencia.

Muaan Ur Rehman, Hayretdin Bahs, Rajesh KalakotiThu, 12 Ma💻 cs

Re-Evaluating EVMBench: Are AI Agents Ready for Smart Contract Security?

Este estudio reevalúa el benchmark EVMbench y demuestra que, debido a limitaciones metodológicas como la contaminación de datos y la falta de estabilidad, los agentes de IA actuales no están listos para la auditoría automatizada completa de contratos inteligentes, sino que funcionan mejor como herramientas de apoyo dentro de un flujo de trabajo con supervisión humana.

Chaoyuan Peng, Lei Wu, Yajin ZhouThu, 12 Ma💻 cs

Backdoor Directions in Vision Transformers

Este artículo demuestra que es posible identificar y manipular causalmente una "dirección de activación" específica en Vision Transformers asociada a ataques de puerta trasera, lo que permite trazar su procesamiento interno, diferenciar tipos de triggers y proponer un método de detección sin datos.

Sengim Karayalcin, Marina Krcek, Pin-Yu Chen, Stjepan PicekThu, 12 Ma💻 cs

MAD: Memory Allocation meets Software Diversity

El artículo presenta MAD, un sistema que combina la asignación de memoria con principios de diversidad de software para mitigar las vulnerabilidades de errores en DRAM y ataques RowHammer mediante técnicas de diversificación espacial, ofreciendo una solución fácil de implementar, agnóstica al hardware y con impacto de rendimiento negligible.

Manuel Wiesinger, Daniel Dorfmeister, Stefan BrunthalerThu, 12 Ma💻 cs

TOSSS: a CVE-based Software Security Benchmark for Large Language Models

El artículo presenta TOSSS, un nuevo benchmark basado en la base de datos CVE que evalúa la capacidad de los modelos de lenguaje grandes para seleccionar fragmentos de código seguros frente a vulnerables, ofreciendo una métrica de seguridad complementaria a las puntuaciones existentes.

Marc Damie, Murat Bilgehan Ertan, Domenico Essoussi, Angela Makhanu, Gaëtan Peter, Roos WensveenThu, 12 Ma🤖 cs.LG

Layered Performance Analysis of TLS 1.3 Handshakes: Classical, Hybrid, and Pure Post-Quantum Key Exchange

Este estudio presenta un análisis de laboratorio que evalúa el impacto de los algoritmos de criptografía post-cuántica (híbridos y puros) frente a los tradicionales en el rendimiento de las transacciones HTTP sobre TLS 1.3, examinando sus efectos específicos en cada capa de la pila de protocolos mediante pruebas de carga de hasta 100 transacciones por segundo.

David Gómez-Cambronero, Daniel Munteanu, Ana Isabel González-TablasThu, 12 Ma💻 cs

Separating Oblivious and Adaptive Differential Privacy under Continual Observation

Este trabajo resuelve una pregunta abierta demostrando la primera separación explícita entre la privacidad diferencial en el modelo de observación continua para los casos no adaptativo y adaptativo, mostrando que un algoritmo no adaptativo puede mantener la precisión durante un número exponencial de pasos temporales mientras que cualquier algoritmo adaptativo falla tras unos pocos pasos.

Mark Bun, Marco Gaboardi, Connor WagamanThu, 12 Ma💻 cs

Adversarial Robustness of Partitioned Quantum Classifiers

Este artículo investiga la robustez adversarial de los clasificadores cuánticos particionados, demostrando que las perturbaciones dirigidas a técnicas de división de circuitos o teletransportación equivalen a la implementación de puertas adversarias en capas intermedias, un fenómeno que se analiza tanto teórica como experimentalmente.

Pouya Kananian, Hans-Arno JacobsenMon, 09 Ma⚛️ quant-ph

HVAC-EAR: Eavesdropping Human Speech Using HVAC Systems

El artículo presenta HVAC-EAR, un sistema que reconstruye el habla inteligible a partir de datos de presión ruidosos de sistemas HVAC utilizando un conformador de valor complejo, demostrando por primera vez que esto es posible a una distancia de 1,2 metros y planteando nuevas preocupaciones sobre la privacidad.

Tarikul Islam Tamiti, Biraj Joshi, Rida Hasan, Anomadarshi BaruaMon, 09 Ma💻 cs

SPARK: Jailbreaking T2V Models by Synergistically Prompting Auditory and Recontextualized Knowledge

El artículo presenta SPARK, un marco de ataque que elude las medidas de seguridad de los modelos de texto a video mediante prompts aparentemente benignos que combinan anclajes escénicos neutrales, desencadenantes auditivos latentes y moduladores estilísticos para inducir la generación de contenido inseguro sin ser detectados.

Zonghao Ying, Moyang Chen, Nizhang Li, Zhiqiang Wang, Wenxin Zhang, Quanchen Zou, Zonglei Jing, Aishan Liu, Xianglong LiuMon, 09 Ma💻 cs

Agent Tools Orchestration Leaks More: Dataset, Benchmark, and Mitigation

Este trabajo presenta el primer estudio sistemático del riesgo de privacidad en la orquestación de herramientas de agentes impulsados por LLMs, definiendo el marco TOP-R, creando el benchmark TOP-Bench para evaluar la fuga de información sensible a través de la inferencia compuesta, e identificando causas raíz y estrategias de mitigación que mejoran significativamente la seguridad sin comprometer la utilidad.

Yuxuan Qiao, Dongqin Liu, Hongchang Yang, Wei Zhou, Songlin HuMon, 09 Ma🤖 cs.AI

Window-based Membership Inference Attacks Against Fine-tuned Large Language Models

El artículo presenta WBC, un nuevo método de ataque de inferencia de membresía para modelos de lenguaje grandes ajustados que supera a las técnicas existentes al analizar señales de memorización localizadas mediante una comparación basada en ventanas deslizantes, en lugar de depender de promedios globales.

Yuetian Chen, Yuntao Du, Kaiyuan Zhang, Ashish Kundu, Charles Fleming, Bruno Ribeiro, Ninghui LiMon, 09 Ma🤖 cs.AI

Peak + Accumulation: A Proxy-Level Scoring Formula for Multi-Turn LLM Attack Detection

Este artículo presenta una fórmula de puntuación "pico + acumulación" que, sin utilizar un LLM, detecta eficazmente inyecciones de prompts de múltiples turnos al combinar el riesgo máximo por turno, la persistencia y la diversidad de categorías, logrando un 90,8% de recuperación con una tasa de falsos positivos del 1,20% en un conjunto de datos de más de 10.000 conversaciones.

J Alex CorllMon, 09 Ma🤖 cs.AI

Scrambler: Mixed Boolean Arithmetic Obfuscation Tool Using E-graph and Equality Expansion

El artículo presenta Scrambler, una herramienta de ofuscación aritmética de lógica mixta basada en e-grafos y expansión de igualdades que genera expresiones complejas y diversas con equivalencia garantizada, superando a las herramientas existentes en expresividad y complejidad.

Seoksu Lee, Sangjun An, Eun-Sun ChoMon, 09 Ma💻 cs

Traversal-as-Policy: Log-Distilled Gated Behavior Trees as Externalized, Verifiable Policies for Safe, Robust, and Efficient Agents

El artículo propone "Traversal-as-Policy", un marco que convierte los registros de ejecución de agentes LLM en árboles de comportamiento con puertas (GBT) ejecutables y verificables, logrando mejorar drásticamente el éxito en tareas complejas, eliminar violaciones de seguridad y reducir costos computacionales al reemplazar la generación libre por una política de control basada en la exploración de macros validadas.

Peiran Li, Jiashuo Sun, Fangzhou Lin, Shuo Xing, Tianfu Fu, Suofei Feng, Chaoqun Ni, Zhengzhong TuMon, 09 Ma🤖 cs.AI

Information-Theoretic Privacy Control for Sequential Multi-Agent LLM Systems

Este trabajo aborda la fuga de información composicional en sistemas secuenciales de agentes LLM, proponiendo un marco de entrenamiento regularizado que demuestra que la privacidad debe gestionarse como una propiedad del sistema y no solo mediante restricciones locales.

Sadia Asif, Mohammad Mohammadi AmiriMon, 09 Ma🤖 cs.LG

Ecosystem Trust Profiles

Este artículo presenta los "perfiles de confianza del ecosistema" como un método para que los ecosistemas digitales definan y anuncien autónomamente sus credenciales, demostrando cómo la interoperabilidad entre ellos depende de la coincidencia en estos perfiles y abordando el dilema de la confianza trans-ecosistema mediante un equilibrio entre la soberanía y la coordinación.

Christoph F. StrnadlMon, 09 Ma💻 cs

Privacy-Preserving Collaborative Medical Image Segmentation Using Latent Transform Networks

Este trabajo presenta el marco PPCMI-SF, una solución de colaboración privada para la segmentación de imágenes médicas que utiliza transformaciones latentes cifradas y mapeo en el servidor para lograr una alta precisión y resistencia a ataques de inferencia sin compartir datos sensibles entre instituciones.

Saheed Ademola Bello, Muhammad Shahid Jabbar, Muhammad Sohail Ibrahim, Shujaat KhanMon, 09 Ma💻 cs

← Anterior Siguiente →