AttriGuard: Defeating Indirect Prompt Injection in LLM Agents via Causal Attribution of Tool Invocations

Het paper introduceert AttriGuard, een runtime-benadering die indirecte prompt-injectie in LLM-agenten effectief bestrijdt door tooloproepen te verifiëren via causale attributie en contrafactuele tests om te onderscheiden tussen acties die voortvloeien uit de gebruikersintentie en die welke door onbetrouwbare externe observaties worden veroorzaakt.

Yu He, Haozhe Zhu, Yiming Li, Shuo Shao, Hongwei Yao, Zhihao Liu, Zhan QinThu, 12 Ma💻 cs

A PUF-Based Approach for Copy Protection of Intellectual Property in Neural Network Models

Dit paper presenteert een aanpak die fysiek onkloonbare functies (PUF's) gebruikt om de gewichten van neurale netwerken te koppelen aan unieke hardware-eigenschappen, waardoor het kopiëren van deze modellen naar gekloonde hardware onmogelijk wordt gemaakt en de intellectuele eigendom effectief wordt beschermd.

Daniel Dorfmeister, Flavio Ferrarotti, Bernhard Fischer, Martin Schwandtner, Hannes SochorThu, 12 Ma🤖 cs.LG

Re-Evaluating EVMBench: Are AI Agents Ready for Smart Contract Security?

Deze studie weerlegt de optimistische conclusies van EVMbench over de onmiddellijke bruikbaarheid van volledig geautomatiseerde AI-audits voor smart contracts door aan te tonen dat de prestaties van agenten instabiel zijn, gevoelig voor data-verontreiniging en afhankelijk van de gebruikte scaffolding, waardoor menselijke expertise in een 'human-in-the-loop'-workflow onmisbaar blijft.

Chaoyuan Peng, Lei Wu, Yajin ZhouThu, 12 Ma💻 cs

Traversal-as-Policy: Log-Distilled Gated Behavior Trees as Externalized, Verifiable Policies for Safe, Robust, and Efficient Agents

Het artikel introduceert Traversal-as-Policy, een methode die OpenHands-uitvoeringslogs distilleert tot een uitvoerbaar, verifieerbaar Gated Behavior Tree-beleid dat autonome agents veiliger, robuuster en efficiënter maakt door het onbeperkte genereren te vervangen door gestructureerde boomtraversie met deterministische veiligheidscontroles.

Peiran Li, Jiashuo Sun, Fangzhou Lin, Shuo Xing, Tianfu Fu, Suofei Feng, Chaoqun Ni, Zhengzhong TuMon, 09 Ma🤖 cs.AI

Privacy-Preserving Collaborative Medical Image Segmentation Using Latent Transform Networks

Dit artikel introduceert het PPCMI-SF-framework, een privacybehoudend systeem voor samenwerking tussen medische instellingen dat door middel van cryptografisch versleutelde latenterepresentaties en een server-zijde vertaalmapping nauwkeurige beeldsegmentatie mogelijk maakt zonder dat gevoelige patiëntdata gedeeld hoeft te worden.

Saheed Ademola Bello, Muhammad Shahid Jabbar, Muhammad Sohail Ibrahim, Shujaat KhanMon, 09 Ma💻 cs