ADVERSA: Measuring Multi-Turn Guardrail Degradation and Judge Reliability in Large Language Models

この論文は、単一のプロンプト評価ではなく持続的な対話におけるガードレールの劣化を連続的に測定し、攻撃モデルの安全性拒否を排除した自動レッドチームングフレームワーク「ADVERSA」を提案し、最先端の LLM における安全性の崩壊ダイナミクスと判定者の信頼性を包括的に評価したものです。

Harry Owiredu-Ashley2026-03-12🤖 cs.AI

Why LLMs Fail: A Failure Analysis and Partial Success Measurement for Automated Security Patch Generation

この論文は、Vul4J ベンチマークを用いた大規模言語モデル(LLM)によるセキュリティパッチ生成の分析を通じて、構文は正しいがセキュリティ修復の意図を誤解するケースが多く、機能維持とセキュリティ修復の間に大きな乖離があることを明らかにし、厳格な検証の必要性を説いています。

Amir Al-Maamari2026-03-12🤖 cs.AI

Marginals Before Conditionals

この論文は、ニューラルネットワークが条件付き学習を行う際、まず条件付きエントロピーに相当する損失のプラトー(定常状態)を経由し、その後、データセットサイズや学習率などの要因によって制御される急激な転移を経て完全な条件付けを獲得するという、学習ダイナミクスにおける「周辺分布の先行」と「条件付き分布の遅延」という非対称性を明らかにしたものである。

Mihir Sahasrabudhe2026-03-12🤖 cs.LG

TASER: Task-Aware Spectral Energy Refine for Backdoor Suppression in UAV Swarms Decentralized Federated Learning

本論文は、UAV スワームの分散フェデレーティング学習において、従来の異常検出に依存せず勾配の周波数特性を利用した「TASER」という新しい防御フレームワークを提案し、巧妙なバックドア攻撃を効果的に抑制しながら主タスクの精度を維持することを示しています。

Sizhe Huang, Shujie Yang2026-03-12🤖 cs.AI

Amnesia: Adversarial Semantic Layer Specific Activation Steering in Large Language Models

この論文は、既存の安全対策をバイパスし、追加の微調整なしで有害なコンテンツを生成させることを可能にする軽量な活性化空間敵対的攻撃手法「Amnesia」を提案し、オープンウェイト大規模言語モデルにおけるセキュリティ対策の強化の緊急性を浮き彫りにしています。

Ali Raza, Gurang Gupta, Nikolay Matyunin, Jibesh Patra2026-03-12🤖 cs.AI

KernelSkill: A Multi-Agent Framework for GPU Kernel Optimization

この論文は、LLM の暗黙的なヒューリスティックに代わって知識駆動型の専門スキルと双層メモリ機構を採用したマルチエージェントフレームワーク「KernelSkill」を提案し、GPU カーネル最適化において既存手法を上回る高い成功率と高速化を実現したことを報告しています。

Qitong Sun, Jun Han, Tianlin Li, Zhe Tang, Sheng Chen, Fei Yang, Aishan Liu, Xianglong Liu, Yang Liu2026-03-12🤖 cs.LG

ES-dLLM: Efficient Inference for Diffusion Large Language Models by Early-Skipping

この論文は、拡散大規模言語モデル(dLLM)の中間表現が反復ごとにわずかにしか変化しないという洞察に基づき、トークンの重要度を推定して早期にスキップするトレーニング不要の高速化フレームワーク「ES-dLLM」を提案し、生成品質を維持しながら最大 16.8 倍の高速化を実現したことを示しています。

Zijian Zhu, Fei Ren, Zhanhong Tan, Kaisheng Ma2026-03-12🤖 cs.LG

Multi-Stream Perturbation Attack: Breaking Safety Alignment of Thinking LLMs Through Concurrent Task Interference

この論文は、思考モードを持つ大規模言語モデルが複数のタスクを同時に処理する際の脆弱性を利用し、複数のタストリームを絡ませる「マルチストリーム摂動攻撃」を提案することで、既存の安全対策を回避し、思考プロセスの崩壊や出力の反復を引き起こすことを示しています。

Fan Yang2026-03-12🤖 cs.AI

Execution Is the New Attack Surface: Survivability-Aware Agentic Crypto Trading with OpenClaw-Style Local Executors

OpenClaw やスキルマーケットの普及に伴い、LLM アジェントの取引における実行リスクが新たな攻撃面となる中、本論文は「Survivability-Aware Execution (SAE)」と呼ばれる実行層の生存性基準を提案し、意図されたポリシーと実際の実行の乖離(Delegation Gap)を可視化・制御することで、取引損失や攻撃成功を劇的に抑制する手法を提示している。

Ailiya Borjigin, Igor Stadnyk, Ben Bilski, Serhii Hovorov, Sofiia Pidturkina2026-03-12🤖 cs.AI

Equivariant Asynchronous Diffusion: An Adaptive Denoising Schedule for Accelerated Molecular Conformation Generation

この論文は、分子生成における階層的な因果関係と分子全体の視野を両立させるため、非同期なノイズ除去スケジュールと動的なスケジューリング機構を組み合わせた新しい等変性非同期拡散モデル(EAD)を提案し、3 次元分子生成において最先端の性能を達成したことを示しています。

Junyi An, Chao Qu, Yun-Fei Shi, Zhijian Zhou, Fenglei Cao, Yuan Qi2026-03-12🧬 q-bio

Code-Space Response Oracles: Generating Interpretable Multi-Agent Policies with Large Language Models

この論文は、解釈性の低い深層強化学習に代わり大規模言語モデルを用いて可読なコードとして方策を生成する「コード空間反応オラクル(CSRO)」という新たなマルチエージェント学習フレームワークを提案し、競合する性能を維持しつつ説明可能な多様な戦略の発見を実現することを示しています。

Daniel Hennes, Zun Li, John Schultz, Marc Lanctot2026-03-12🤖 cs.AI

Hardware Efficient Approximate Convolution with Tunable Error Tolerance for CNNs

この論文は、従来のハードスパースティの限界を克服し、最上位ビット(MSB)を代理として利用する「ソフトスパースティ」パラダイムを提案することで、ReLU および Tanh 活性化関数を用いた CNN の推論において、精度を損なわずに乗算演算を大幅に削減し、エッジデバイス向けに電力効率を向上させる手法を提示しています。

Vishal Shashidhar, Anupam Kumari, Roy P Paily2026-03-12🤖 cs.LG

CLIPO: Contrastive Learning in Policy Optimization Generalizes RLVR

この論文は、最終的な正解だけでなく中間推論ステップの正しさも考慮する対照学習を組み込んだ CLIPO を提案し、LLM の推論におけるハルシネーションや一般化性の欠如といった RLVR の課題を解決し、頑健な政策最適化を実現する手法を提示しています。

Sijia Cui, Pengyu Cheng, Jiajun Song, Yongbo Gai, Guojun Zhang, Zhechao Yu, Jianhe Lin, Xiaoxi Jiang, Guanjun Jiang2026-03-12🤖 cs.LG

Lost in the Middle at Birth: An Exact Theory of Transformer Position Bias

この論文は、LLM の「真ん中の情報を見失う(Lost in the Middle)」現象が学習や位置符号化に起因するのではなく、残差接続を持つ因果的デコーダの幾何学的性質に由来し、初期化段階(トレーニング前)ですでに存在する構造的な偏りであることを、厳密な理論と実験的検証によって明らかにしたものである。

Borun D Chowdhury2026-03-12🤖 cs.LG

AR-VLA: True Autoregressive Action Expert for Vision-Language-Action Models

本論文は、従来の反応的な VLA モデルが抱える時制の不一致や文脈の欠如を解決するため、独自の長期記憶を維持して連続的な動作を生成する「AR-VLA」と呼ばれる新しい自己回帰型アクション専門モジュールを提案し、より滑らかで文脈に敏感なロボット制御を実現する手法を提示しています。

Yutong Hu, Jan-Nico Zaech, Nikolay Nikolov, Yuanqi Yao, Sombit Dey, Giuliano Albanese, Renaud Detry, Luc Van Gool, Danda Paudel2026-03-12🤖 cs.AI

Agentic Control Center for Data Product Optimization

この論文は、ドメイン専門家の手作業に依存していたデータ製品の改善を、質問の提示や多面的な品質指標の監視、そして人間の介入を可能にする制御機能を備えた専門 AI エージェントによる継続的最適化ループを通じて自動化するシステムを提案しています。

Priyadarshini Tamilselvan, Gregory Bramble, Sola Shirai, Ken C. L. Wong, Faisal Chowdhury, Horst Samulowitz2026-03-12🤖 cs.AI