cs.CR papers | Gist.Science

Shadow in the Cache: Unveiling and Mitigating Privacy Risks of KV-cache in LLM Inference

Dit paper introduceert drie nieuwe aanvallen die gevoelige invoer van grote taalmodellen via de KV-cache kunnen reconstrueren en stelt KV-Cloak voor, een lichtgewicht verdedigingsmechanisme dat deze privacyrisico's effectief neutraliseert zonder de prestaties of nauwkeurigheid van het model te beïnvloeden.

Zhifan Luo, Shuo Shao, Su Zhang, Lijing Zhou, Yuke Hu, Chenxu Zhao, Zhihao Liu, Zhan QinThu, 12 Ma💬 cs.CL

Hierarchical Dual-Strategy Unlearning for Biomedical and Healthcare Intelligence Using Imperfect and Privacy-Sensitive Medical Data

Deze paper introduceert een hiërarchisch dubbelstrategisch kader voor selectief vergeten in medische grote taalmodellen dat, door het combineren van geometrisch beperkte gradiëntupdates en conceptbewuste tokeninterventies, specifieke privacygevoelige kennis effectief verwijdert terwijl fundamentele medische competenties behouden blijven en slechts 0,1% van de parameters wordt aangepast.

Yi Zhang, Chao Zhang, Zijian Li, Tianxiang Xu, Kunyu Zhang, Zhan Gao, Meinuo Li, Xiaohan Zhang, Qichao Qi, Bing ChenThu, 12 Ma🤖 cs.LG

Burn-After-Use for Preventing Data Leakage through a Secure Multi-Tenant Architecture in Enterprise LLM

Dit artikel introduceert een veilige multi-tenant architectuur gecombineerd met een 'Burn-After-Use'-mechanisme om datalekken in enterprise LLM-omgevingen te voorkomen door strikte isolatie en automatische vernietiging van ephemerale conversatiecontexten.

Qiang Zhang, Elena Emma Wang, Jiaming Li, Xichun WangThu, 12 Ma🤖 cs.AI

Beyond Max Tokens: Stealthy Resource Amplification via Tool Calling Chains in LLM Agents

Deze paper introduceert een sluwe, multi-turn Denial-of-Service-aanval op LLM-agenten via tool-callings die, door middel van tekstbewerkingen en Monte Carlo Tree Search, de kosten en energieverbruik drastisch opvoert zonder dat standaard filters dit detecteren.

Kaiyu Zhou, Yongsen Zheng, Yicheng He, Meng Xue, Xueluan Gong, Yuji Wang, Xuanye Zhang, Kwok-Yan LamThu, 12 Ma🤖 cs.AI

Adversarial Hubness Detector: Detecting Hubness Poisoning in Retrieval-Augmented Generation Systems

Dit paper introduceert Hubscan, een open-source beveiligingsscanner die hubness-vergiftiging in Retrieval-Augmented Generation-systemen detecteert door een multi-detectorarchitectuur te gebruiken die statistische analyse, clusterverdeling en stabiliteitstests combineert om schadelijke 'hubs' in vectorindexen te identificeren.

Idan Habler, Vineeth Sai Narajala, Stav Koren, Amy Chang, Tiffany SaadeThu, 12 Ma🤖 cs.AI

Defensive Refusal Bias: How Safety Alignment Fails Cyber Defenders

Dit onderzoek toont aan dat veiligheidsgealigneerde grote taalmodellen een 'defensieve weigeringsbias' vertonen waarbij ze geautoriseerde cyberverdedigingstaken onterecht weigeren vanwege het gebruik van gevoelige termen, zelfs wanneer expliciete autorisatie wordt gegeven, wat wijst op een tekortkoming in het onderscheiden van intentie en autorisatie.

David Campbell, Neil Kale, Udari Madhushani Sehwag, Bert Herring, Nick Price, Dan Borges, Alex Levinson, Christina Q KnightThu, 12 Ma🤖 cs.AI

Kraken: Higher-order EM Side-Channel Attacks on DNNs in Near and Far Field

Dit paper introduceert Kraken, een nieuwe aanvalstechniek die voor het eerst parameters van DNN's op GPU's kan stelen via elektromagnetische zijkanalen op Tensor Cores, zowel in de nabije als de verre afstand.

Peter Horvath, Ilia Shumailov, Lukasz Chmielewski, Lejla Batina, Yuval YaromThu, 12 Ma💻 cs

There Are No Silly Questions: Evaluation of Offline LLM Capabilities from a Turkish Perspective

Dit onderzoek evalueert de robuustheid en pedagogische veiligheid van offline grote taalmodellen voor het Turks erfgoedonderwijs en concludeert dat modellen met 8 tot 14 miljard parameters de beste balans bieden tussen kosten en veiligheid, aangezien grotere schaal niet automatisch leidt tot betere weerstand tegen anomalieën of minder sycofantische bias.

Edibe Yilmaz, Kahraman KostasThu, 12 Ma💬 cs.CL

Evaluating Generalization Mechanisms in Autonomous Cyber Attack Agents

Dit artikel evalueert hoe goed autonome cyberaanval-agenten generaliseren bij onverwachte IP-adreswijzigingen en concludeert dat hoewel prompt-gedreven LLM-agenten de beste prestaties leveren op onbekende scenario's, dit ten koste gaat van transparantie en rekenkracht, terwijl andere aanpassingsmethoden significant prestatieverlies vertonen.

Ondřej Lukáš, Jihoon Shin, Emilia Rivas, Diego Forni, Maria Rigaki, Carlos Catania, Aritran Piplai, Christopher Kiekintveld, Sebastian GarciaThu, 12 Ma💻 cs

Targeted Bit-Flip Attacks on LLM-Based Agents

Dit paper introduceert Flip-Agent, het eerste framework voor gerichte bit-flip-aanvallen dat hardwarefouten benut om niet alleen de uiteindelijke output, maar ook de tool-uitvoeringen van LLM-gebaseerde agenten te manipuleren, waardoor een nieuwe kwetsbaarheid in deze systemen wordt blootgelegd.

Jialai Wang, Ya Wen, Zhongmou Liu, Yuxiao Wu, Bingyi He, Zongpeng Li, Ee-Chien ChangThu, 12 Ma🤖 cs.AI

Where Do Flow Semantics Reside? A Protocol-Native Tabular Pretraining Paradigm for Encrypted Traffic Classification

Deze paper introduceert FlowSem-MAE, een protocol-natief tabulair pretrainingsparadigma dat de inductieve bias-mismatch van bestaande byte-sequentiemethoden oplost door protocolsemantiek te respecteren, waardoor het encrypted traffic classificatie aanzienlijk verbetert met slechts de helft van de gelabelde data.

Sizhe Huang, Shujie YangThu, 12 Ma🤖 cs.AI

OAuthHub: Mitigating OAuth Data Overaccess through a Local Data Hub

Dit paper introduceert OAuthHub, een ontwikkelkader dat gebruikersapparaten gebruikt als tussenliggende controller om OAuth-gegevensoverdracht te beperken tot specifieke momenten, waardoor ontwikkelaars minder code nodig hebben en de prestaties nauwelijks worden beïnvloed.

Qiyu Li, Yuhe Tian, Haojian JinThu, 12 Ma💻 cs

SBOMs into Agentic AIBOMs: Schema Extensions, Agentic Orchestration, and Reproducibility Evaluation

Dit artikel introduceert Agentic AIBOMs, een uitbreiding van traditionele SBOMs met een multi-agent architectuur die dynamische runtime-gedragingen en kwetsbaarheidscontext vastlegt om reproduceerbaarheid en exploitatiebeoordeling te verbeteren.

Petar Radanliev, Carsten Maple, Omar Santos, Kayvan AtefiThu, 12 Ma🤖 cs.AI

Tool Receipts, Not Zero-Knowledge Proofs: Practical Hallucination Detection for AI Agents

Het paper introduceert NabaOS, een lichtgewicht verificatiekader dat, geïnspireerd door de Indiase Nyaya Shastra-epistemologie, gebruikmaakt van HMAC-gesigneerde tool-ontvangstbewijzen in plaats van zware zero-knowledge-bewijzen om hallucinaties van AI-agenten in real-time met minimale latentie te detecteren.

Abhinaba BasuThu, 12 Ma🤖 cs.AI

Building Privacy-and-Security-Focused Federated Learning Infrastructure for Global Multi-Centre Healthcare Research

Dit artikel introduceert FLA³, een federatief leerplatform dat door middel van runtime-beleidshandhaving, attributengebaseerde toegangscontrole en cryptografische verantwoording governance-risico's aanpakt en zo privacybewuste, schaalbare AI-toepassingen in grensoverschrijdende gezondheidszorg mogelijk maakt.

Fan Zhang, Daniel Kreuter, Javier Fernandez-Marques, BloodCounts Consortium, Gregory Verghese, Bernard Butler, Nicholas Lane, Suthesh Sivapalaratnam, Joseph Taylor, Norbert C. J. de Wit, Nicholas S. Gleadall, Carola-Bibiane Schönlieb, Michael RobertsThu, 12 Ma💻 cs

ADVERSA: Measuring Multi-Turn Guardrail Degradation and Judge Reliability in Large Language Models

Het paper introduceert ADVERSA, een geautomatiseerd red-teaming-framework dat de degradatie van veiligheidsbarrières in grote taalmodellen tijdens meervoudige interacties meet en de betrouwbaarheid van beoordelaars kwantificeert, waarbij experimenten aantonen dat succesvolle jailbreaks zich voornamelijk in de vroege rondes voordoen in plaats van door langdurige druk te accumuleren.

Harry Owiredu-AshleyThu, 12 Ma🤖 cs.AI

Why LLMs Fail: A Failure Analysis and Partial Success Measurement for Automated Security Patch Generation

Deze studie analyseert 319 door LLM's gegenereerde beveiligingspatches en concludeert dat deze modellen, ondanks het behoud van functionaliteit, vaak falen in het correct oplossen van kwetsbaarheden door semantisch misverstand, wat strenge validatie voorafgaand aan implementatie noodzakelijk maakt.

Amir Al-MaamariThu, 12 Ma🤖 cs.AI

TASER: Task-Aware Spectral Energy Refine for Backdoor Suppression in UAV Swarms Decentralized Federated Learning

Dit paper introduceert TASER, een efficiënt decentraal verdedigingskader voor UAV-zwermen dat gebruikmaakt van spectrale energieconcentratie in plaats van complexe uitbijterdetectie om sluwe backdoor-aanvallen in Federated Learning-systemen effectief te onderdrukken.

Sizhe Huang, Shujie YangThu, 12 Ma🤖 cs.AI

Amnesia: Adversarial Semantic Layer Specific Activation Steering in Large Language Models

Dit paper introduceert Amnesia, een lichtgewicht aanvalstechniek die interne transformer-activaties manipuleert om bestaande veiligheidsmechanismen in open-weight grote taalmodellen te omzeilen en zo schadelijke inhoud te genereren zonder aanvullende training.

Ali Raza, Gurang Gupta, Nikolay Matyunin, Jibesh PatraThu, 12 Ma🤖 cs.AI

Multi-Stream Perturbation Attack: Breaking Safety Alignment of Thinking LLMs Through Concurrent Task Interference

Dit paper introduceert de 'Multi-Stream Perturbation Attack', een methode die de veiligheidsuitlijning van denkende LLM's omzeilt door meerdere taakstromen te verweven, wat leidt tot een ineenstorting van het redeneerproces en een hoge succesgraad bij jailbreak-aanvallen.

Fan YangThu, 12 Ma🤖 cs.AI

← Vorige Volgende →