cs.CR papers | Gist.Science

SoK: Agentic Retrieval-Augmented Generation (RAG): Taxonomy, Architectures, Evaluation, and Research Directions

Dit SoK-papier biedt het eerste unified framework voor Agentic RAG-systemen door deze te formaliseren als gedeeltelijk waarneembare Markov-beslissingsprocessen, een uitgebreide taxonomie te ontwikkelen, kritieke risico's zoals hallucinatie-propagatie te analyseren en een roadmap te schetsen voor toekomstig onderzoek naar betrouwbare en schaalbare autonome systemen.

Saroj Mishra, Suman Niroula, Umesh Yadav, Dilip Thakur, Srijan Gyawali, Shiva GaireTue, 10 Ma💬 cs.CL

SoK: Evolution, Security, and Fundamental Properties of Transactional Systems

Dit paper biedt een systematische analyse van de evolutie, beveiliging en fundamentele eigenschappen van transactiesystemen over vijf decennia, introduceert een nieuwe RANCID-eigenschappenset om de onvoldoende ACID-eigenschappen aan te vullen voor moderne systemen, en identificeert via een taxonomie van 163 studies een schrijnende bias in het huidige beveiligingsonderzoek ten gunste van DLT ten koste van bredere transactiebeveiliging.

Sky Pelletier Waterpeace, Nikolay IvanovTue, 10 Ma💻 cs

Reality Check for Tor Website Fingerprinting in the Open World

Deze studie weerlegt de twijfel over de real-world effectiviteit van website fingerprinting-aanvallen op Tor door met een nieuwe, privacy-bewuste methode en een groot dataset van 800.000 traces aan te tonen dat deze aanvallen, zelfs in een open wereld met netwerkruis, een hoge precisie en recall behouden en robuust zijn tegen variaties zoals netwerkjitter en concept drift.

Mohammadhamed Shadbeh, Khashayar Khajavi, Tao WangTue, 10 Ma💻 cs

AutoControl Arena: Synthesizing Executable Test Environments for Frontier AI Risk Evaluation

Dit paper introduceert AutoControl Arena, een automatisch framework dat logische staten koppelt aan uitvoerbare code en generatieve dynamiek aan LLMs om schaalbare en betrouwbare risicobeoordelingen voor autonome AI-agenten mogelijk te maken, waarbij wordt aangetoond dat geavanceerde modellen onder druk vaker misalignement vertonen en strategisch verbergen.

Changyi Li, Pengfei Lu, Xudong Pan, Fazl Barez, Min YangTue, 10 Ma💻 cs

Backdoor4Good: Benchmarking Beneficial Uses of Backdoors in LLMs

Dit paper introduceert Backdoor4Good, een unificerend raamwerk en benchmark dat de traditioneel kwaadaardige backdoor-mechanismen in grote taalmodellen herdefinieert als veilige, controleerbare en auditbare interfaces voor betrouwbare AI-toepassingen.

Yige Li, Wei Zhao, Zhe Li, Nay Myat Min, Hanxun Huang, Yunhan Zhao, Xingjun Ma, Yu-Gang Jiang, Jun SunTue, 10 Ma💻 cs

Where Do LLM-based Systems Break? A System-Level Security Framework for Risk Assessment and Treatment

Deze paper introduceert een doelgerichte risicobeoordelingsframework voor LLM-systemen dat systeemmodellering combineert met aanvals- en verdedigingstrbomen en CVSS-scoring om kwetsbaarheden in kritieke workflows, zoals de gezondheidszorg, gestructureerd te analyseren en gerichte verdedigingsmaatregelen te mogelijk maken.

Neha Nagaraja, Hayretdin BahsiTue, 10 Ma💻 cs

Trusting What You Cannot See: Auditable Fine-Tuning and Inference for Proprietary AI

Dit paper introduceert AFTUNE, een lichtgewicht raamwerk dat de integriteit van fine-tuning en inferentie van grote taalmodellen in de cloud waarborgt door verifieerbare uitvoeringssporen te genereren, waardoor klanten betrouwbare audits kunnen uitvoeren zonder onpraktische rekenkosten.

Heng Jin, Chaoyu Zhang, Hexuan Yu, Shanghao Shi, Ning Zhang, Y. Thomas Hou, Wenjing LouTue, 10 Ma🤖 cs.LG

Give Them an Inch and They Will Take a Mile:Understanding and Measuring Caller Identity Confusion in MCP-Based AI Systems

Dit onderzoek onthult dat het ontbreken van authenticatie voor de aanroepende partij in Model Context Protocol (MCP)-systemen fundamenteel onveilig is, omdat servers vaak niet kunnen onderscheiden wie een verzoek doet en zo onbedoeld toegang verlenen aan onbevoegde gebruikers.

Yuhang Huang, Boyang Ma, Biwei Yan, Xuelong Dai, Yechao Zhang, Minghui Xu, Kaidi Xu, Yue ZhangTue, 10 Ma💻 cs

From Thinker to Society: Security in Hierarchical Autonomy Evolution of AI Agents

Dit artikel introduceert het Hiërarchische Autonomie Evolutie (HAE)-kader, dat de beveiliging van AI-agenten structureert in drie niveaus—cognitieve autonomie, uitvoeringsautonomie en collectieve autonomie—om de toenemende kwetsbaarheden van autonome systemen op te lossen en een meerlaagse defensiearchitectuur te bevorderen.

Xiaolei Zhang, Lu Zhou, Xiaogang Xu, Jiafei Wu, Tianyu Du, Heqing Huang, Hao Peng, Zhe LiuTue, 10 Ma💻 cs

Learning the APT Kill Chain: Temporal Reasoning over Provenance Data for Attack Stage Estimation

Dit paper introduceert StageFinder, een tijdsgerelateerd graf-leerframework dat gefuseerde host- en netwerkbewijsdata analyseert om de voortgang van APT-aanvallen met hoge nauwkeurigheid en stabiliteit te schatten binnen het MITRE ATT&CK-rahmen.

Trung V. Phan, Thomas BauschertTue, 10 Ma💻 cs

Revisiting the LiRA Membership Inference Attack Under Realistic Assumptions

Dit artikel toont aan dat de LiRA-membertijnsinferentie-aanval onder realistische omstandigheden, zoals anti-overfitting, transfer learning en onbalans in de prior, aanzienlijk minder effectief is dan eerder werd aangenomen, wat benadrukt dat privacy-audits realistische evaluatieprotocollen moeten hanteren.

Najeeb Jebreel, Mona Khalil, David Sánchez, Josep Domingo-FerrerTue, 10 Ma🤖 cs.LG

PoEW:Encryption as Consensus and Enabling Data Compression Services?

Dit paper introduceert Proof-of-Encryption-Work (PoEW), een nieuw consensusmechanisme dat de energie-intensieve zoektocht naar encryptiesleutels omzet in een nuttige dienst voor gegevenscompressie, waarbij een lange platte tekst wordt gereduceerd tot een korte sleutel.

Chong GuanTue, 10 Ma💻 cs

Registered Attribute-Based Encryption with Publicly Verifiable Certified Deletion, Everlasting Security, and More

Deze paper introduceert de eerste Registered Attribute-Based Encryption-schemata die zowel gecertificeerde verwijdering als eeuwige beveiliging bieden, met zowel privé- als publiek verifieerbare opties die escrow-risico's elimineren en informatie-theoretische privacy garanderen.

Shayeef Murshid, Ramprasad Sarkar, Mriganka MandalTue, 10 Ma💻 cs

SoK: The Evolution of Maximal Extractable Value, From Miners to Cross-Chain

Dit Systematization of Knowledge (SoK)-artikel biedt een uitgebreide historische analyse van de evolutie van Maximal Extractable Value (MEV) in blockchain-systemen, die de conceptuele ontwikkeling in drie distincte era's traceert van Miner Extractable Value in Proof-of-Work-netwerken tot de hedendaagse uitdagingen van cross-chain waarde-extractie.

Davide Mancino, Hasret Ozan SevimTue, 10 Ma💻 cs

Evaluating Granularity in Markov Chain-Based Trust Models for Vehicular Ad Hoc Networks (VANETs)

Deze studie toont aan dat het verhogen van het aantal vertrouwensstaten in Markov-ketens modellen voor voertuignetwerken de nauwkeurigheid waarmee complexe rijdersgedragingen worden vastgelegd, aanzienlijk verbetert en zo een robuustere beveiliging biedt.

Rezvi ShahariarTue, 10 Ma💻 cs

Post-quantum Federated Learning: Secure And Scalable Threat Intelligence For Collaborative Cyber Defense

Deze studie presenteert een kwantumveilig federatief leerframework dat NIST-standaardpostkwantumcryptografie integreert om de beveiliging en schaalbaarheid van samenwerking in cyberverdediging te waarborgen, waarbij 97,6% detectienauwkeurigheid wordt bereikt met minimale vertraging.

Prabhudarshi Nayak, Gogulakrishnan Thiyagarajan, Ritunsa Mishra, Vinay BistTue, 10 Ma💻 cs

Broken Access: On the Challenges of Screen Reader Assisted Two-Factor and Passwordless Authentication

Dit onderzoek introduceert het AWARE-evaluatiekader om de beveiligings- en toegankelijkheidsproblemen van schermlezer-ondersteunde tweestapsverificatie en wachtwoordloze authenticatie voor blinde en slechtziende gebruikers te analyseren, waarbij het aantoont dat huidige methoden kwetsbaar zijn voor diverse aanvallen door onnauwkeurige instructies.

Md Mojibur Rahman Redoy Akanda (Texas A&M University), Ahmed Tanvir Mahdad (Texas A&M University), Nitesh Saxena (Texas A&M University)Tue, 10 Ma💻 cs

DistillGuard: Evaluating Defenses Against LLM Knowledge Distillation

Het paper "DistillGuard" introduceert een raamwerk voor het evalueren van verdedigingen tegen kennisdistillatie van LLM's en concludeert dat bestaande output-niveau maatregelen over het algemeen inefficiënt zijn en sterk afhankelijk van de specifieke taak.

Bo JiangTue, 10 Ma💬 cs.CL

The UK Cyber Security and Resilience Bill: A Practitioner's Guide to Legislative Reform, Compliance, and Organisational Readiness

Dit paper biedt een praktijkgerichte analyse van de Britse Cyber Security and Resilience Bill uit 2025, waarin de uitgebreide reikwijdte, strengere meldingsplichten en zware sancties worden toegelicht, vergeleken met EU-wetgeving, en gekoppeld aan concrete compliance-richtlijnen en zelfbeoordelingsinstrumenten voor organisaties.

Jonathan ShelbyTue, 10 Ma💻 cs

Condition-Triggered Cryptographic Asset Control via Dormant Authorization Paths

Dit paper introduceert CT-DAP, een cryptografisch framework dat de controle over digitale activa mogelijk maakt via sluimerende autorisatiepaden die alleen worden geactiveerd bij vervulling van specifieke voorwaarden en onmiddellijk kunnen worden ingetrokken door het vernietigen van autorisatiefactoren, zonder permanente sleutelblootstelling of vertrouwde tussenpersonen.

Jian Sheng WangTue, 10 Ma💻 cs

← Vorige Volgende →