Benchmark of Benchmarks: Unpacking Influence and Code Repository Quality in LLM Safety Benchmarks

本論文は、LLM 安全性ベンチマーク 31 件を対象とした初の多面的評価を通じて、論文の学術的影響力とコード品質の間に乖離があること、また多くのリポジトリが実用性や倫理面において改善の余地が大きいことを明らかにし、著名な研究者に基準向上の主導を求めています。

Junjie Chu, Xinyue Shen, Ye Leng, Michael Backes, Yun Shen, Yang Zhang2026-03-06🔒 cs.CR

Beyond Input Guardrails: Reconstructing Cross-Agent Semantic Flows for Execution-Aware Attack Detection

本論文は、従来の入力ガードレールでは回避可能なマルチエージェントシステムにおける間接的プロンプトインジェクションなどのリスクに対処するため、実行時の分析に基づきエージェント間の意味的フローを再構築し、異常を検知する新しいフレームワーク「SysName」を提案し、その有効性を示しています。

Yangyang Wei, Yijie Xu, Zhenyuan Li, Xiangmin Shen, Shouling Ji2026-03-06🔒 cs.CR

Impact of 5G SA Logical Vulnerabilities on UAV Communications: Threat Models and Testbed Evaluation

本論文は、Open5GS や UERANSIM を用いたテストベッド実験を通じて、5G スタンダローンネットワークにおける論理的脆弱性が UAV の通信に与える影響を評価し、攻撃経路に応じた制御コマンドの改ざんやセッション切断などの脅威を明らかにするとともに、ユーザープレーンの分離とコマンドプロトコルの完全性保護の必要性を強調しています。

Wagner Comin Sonaglio, Ágney Lopes Roth Ferraz, Lourenço Alves Pereira Júnior2026-03-06🔒 cs.CR

When Denoising Becomes Unsigning: Theoretical and Empirical Analysis of Watermark Fragility Under Diffusion-Based Image Editing

本論文は、拡散モデルに基づく画像編集が、従来のノイズや圧縮に耐性を持つように設計された不可視透かしを、拡散過程におけるノイズ注入と学習された復元ダイナミクスによって実質的に無効化してしまうという理論的・実証的脆弱性を明らかにし、生成変換時代における透かしの設計指針を提言するものである。

Fai Gu, Qiyu Tang, Te Wen, Emily Davis, Finn Carter2026-03-06🔒 cs.CR

Efficient Privacy-Preserving Sparse Matrix-Vector Multiplication Using Homomorphic Encryption

この論文は、ホモモルフィック暗号とスパース行列・ベクトル積(SpMV)を効率的に統合する初のフレームワークを提案し、特に「圧縮ソート列(CSSC)」という新規データ形式を導入することで、暗号化されたスパース行列計算における計算効率とデータプライバシーの両立を実現したことを示しています。

Yang Gao, Gang Quan, Wujie Wen, Scott Piersall, Qian Lou, Liqiang Wang2026-03-06🔒 cs.CR

AgentSCOPE: Evaluating Contextual Privacy Across Agentic Workflows

この論文は、エージェントシステムにおけるプライバシーリスクが最終出力だけでなく中間情報フロー全体に存在することを指摘し、文脈的整合性に基づいた「Privacy Flow Graph」フレームワークと「AgentSCOPE」ベンチマークを提案することで、従来の評価手法では見逃されていたパイプライン段階での広範なプライバシー侵害の実態を明らかにしています。

Ivoline C. Ngong, Keerthiram Murugesan, Swanand Kadhe, Justin D. Weisz, Amit Dhurandhar, Karthikeyan Natesan Ramamurthy2026-03-06🔒 cs.CR

EVMbench: Evaluating AI Agents on Smart Contract Security

本論文は、スマートコントラクトの脆弱性検出、修正、悪用における AI エージェントの能力を評価するベンチマーク「EVMbench」を提案し、最先端の AI エージェントがローカルな Ethereum 実行環境において脆弱性を発見し、エンドツーエンドで悪用できることを実証しています。

Justin Wang, Andreas Bigger, Xiaohai Xu, Justin W. Lin, Andy Applebaum, Tejal Patwardhan, Alpin Yukseloglu, Olivia Watkins2026-03-06🔒 cs.CR

A Practical Post-Quantum Distributed Ledger Protocol for Financial Institutions

この論文は、金融機関の機密性と監査可能性の要件を満たすため、ゼロ知識証明と新しいコンパクトな範囲証明を活用した、ポスト量子耐性を持つ分散型台帳トランザクション方式を提案し、その安全性を分析したものである。

Yeoh Wei Zhu, Naresh Goud Boddu, Yao Ma, Shaltiel Eloul, Giulio Golinelli, Yash Satsangi, Rob Otter, Kaushik Chakraborty2026-03-06🔒 cs.CR

Cyber Threat Intelligence for Artificial Intelligence Systems

本論文は、従来のサイバー脅威インテリジェンスの限界を踏まえ、AI 特有の脆弱性やサプライチェーンを網羅した新たな知識基盤の構築、具体的な侵害指標の提示、および類似性評価手法の検討を通じて、AI システムに特化した実践的な脅威インテリジェンス枠組みの確立に向けた課題と将来の研究方向を明らかにしています。

Natalia Krawczyk, Mateusz Szczepkowski, Adrian Brodzik, Krzysztof Bocianiak2026-03-06🔒 cs.CR

Robust Single-message Shuffle Differential Privacy Protocol for Accurate Distribution Estimation

この論文は、既存の手法が利便性、メッセージ複雑性、耐攻撃性のバランスを達成できないという課題に対し、相互情報量のより厳密な上限に基づく最適化されたランダム化器と、適応的平滑化を備えた期待値最大化アルゴリズム(EMAS)を組み合わせた単一メッセージの新しいプロトコル「ASP」を提案し、純粋なシャッフル差分プライバシー枠組み下での分布推定の精度と堅牢性を大幅に向上させることを示しています。

Xiaoguang Li, Hanyi Wang, Yaowei Huang, Jungang Yang, Qingqing Ye, Haonan Yan, Ke Pan, Zhe Sun, Hui Li2026-03-06🔒 cs.CR

Sample-Optimal Locally Private Hypothesis Selection and the Provable Benefits of Interactivity

この論文は、局所差分プライバシー制約下での仮説選択問題において、相互作用をわずかに用いることで非相互作用アルゴリズムのサンプル複雑性の下限を破り、kk 分布クラスに対して最適なサンプル数 Θ(kα2min{ε2,1})\Theta\left(\frac{k}{\alpha^2\min \{\varepsilon^2,1\}}\right) を達成するアルゴリズムを提案し、その証明に「クリティカルクエリ」という新たな概念を導入したことを示しています。

Alireza F. Pour, Hassan Ashtiani, Shahab Asoodeh2026-03-05🤖 cs.LG

Plug-and-Hide: Provable and Adjustable Diffusion Generative Steganography

本論文は、既存の画像を必要とせず秘密情報を埋め込む拡散モデル基盤の生成式ステガノグラフィにおいて、画像品質・セキュリティ・抽出信頼性のトレードオフを解決し、任意の長さのビット列を純粋なガウスノイズに可逆的に符号化する「PA-B2G」というモデル非依存の手法を提案し、理論的保証と高い実用性を両立させることを示しています。

Jiahao Zhu, Zixuan Chen, Jiali Liu + 3 more2026-03-05💻 cs

When Memory Becomes a Vulnerability: Towards Multi-turn Jailbreak Attacks against Text-to-Image Generation Systems

本論文は、テキストから画像を生成するシステムが持つ「記憶機能」を悪用し、セグメンテーションと再帰処理を組み合わせて多回対話で安全フィルターを回避する新たなジェイルブレイク攻撃手法「Inception」を提案し、その実世界プラットフォームにおける有効性を示したものである。

Shiqian Zhao, Jiayang Liu, Yiming Li + 9 more2026-03-05💻 cs