cs.AI 件の論文 | Gist.Science

Arbiter: Detecting Interference in LLM Agent System Prompts

本論文は、LLM ベースのコーディングエージェントのシステムプロンプトにおける干渉パターンを検出するフレームワーク「Arbiter」を提案し、主要なベンダーのプロンプトに多数の脆弱性を発見し、プロンプト構造と失敗クラスの相関やマルチモデル評価の重要性を実証した。

Tony Mason2026-03-11🤖 cs.AI

Security Considerations for Multi-agent Systems

本論文は、自律エージェント間の協調によって生じる新たなセキュリティ脅威を体系的に分析し、既存の 16 のセキュリティフレームワークを評価した結果、どのフレームワークも包括的な対策を欠いており、特に OWASP のイニシアチブや CDAO のツールキットが相対的に優れていることを実証的に示しています。

Tam Nguyen, Moses Ndebugre, Dheeraj Arremsetty2026-03-11🤖 cs.AI

Gender Fairness in Audio Deepfake Detection: Performance and Disparity Analysis

本論文は、ASVspoof 5 データセットを用いた音声ディープフェイク検出モデルの分析を通じて、従来の総合誤り率だけでは隠れてしまう性別による性能偏在を公平性指標で明らかにし、より公平で信頼性の高いシステム構築には公平性重視の評価が不可欠であることを示しています。

Aishwarya Fursule, Shruti Kshirsagar, Anderson R. Avila2026-03-11🤖 cs.AI

Improving through Interaction: Searching Behavioral Representation Spaces with CMA-ES-IG

この論文は、ロボットの行動表現空間を探索する際に、ユーザーの体験を考慮して知覚的に明確で情報量の多い軌道を提案する「CMA-ES-IG」というアルゴリズムを提案し、高次元空間でのスケーラビリティ、計算効率、ノイズへの頑健性、および非専門家ユーザーによる評価の向上を実験的に実証したものである。

Nathaniel Dennler, Zhonghao Shi, Yiran Tao, Andreea Bobu, Stefanos Nikolaidis, Maja Mataric2026-03-11🤖 cs.AI

Meissa: Multi-modal Medical Agentic Intelligence

API 依存の医療 AI が抱えるコストやプライバシー課題を解決するため、最先端モデルから戦略的行動を蒸留した軽量な 40 億パラメータのマルチモーダル医療エージェント「Meissa」を提案し、オフライン環境で最先端モデルに匹敵する性能と大幅な低遅延を実現したことを示しています。

Yixiong Chen, Xinyi Bai, Yue Pan, Zongwei Zhou, Alan Yuille2026-03-11🤖 cs.AI

AI Phenomenology for Understanding Human-AI Experiences Across Eras

この論文は、従来の評価指標では捉えきれない人間と AI の複雑な体験を「AI 現象学」という枠組みで理解し、ユーザーの第一人称の感覚を重視する研究方法論、設計概念、および研究課題を提示しています。

Bhada Yun, Evgenia Taranova, Dana Feng, Renn Su, April Yi Wang2026-03-11🤖 cs.AI

MEMO: Memory-Augmented Model Context Optimization for Robust Multi-Turn Multi-Agent LLM Games

この論文は、マルチターン・マルチエージェント LLM ゲームにおける推論時のコンテキストを、自己対戦から得られた構造化された知見を保持する「保持」と、不確実性を考慮したプロンプト進化を行う「探索」を組み合わせる MEMO というフレームワークで最適化することで、勝率の向上と結果の安定化を実現することを提案しています。

Yunfei Xie, Kevin Wang, Bobby Cheng, Jianzhu Yao, Zhizhou Sha, Alexander Duffy, Yihan Xi, Hongyuan Mei, Cheston Tan, Chen Wei, Pramod Viswanath, Zhangyang Wang2026-03-11🤖 cs.AI

The Missing Memory Hierarchy: Demand Paging for LLM Context Windows

この論文は、LLM のコンテキストウィンドウを単なるキャッシュではなく、仮想メモリとして扱う「Pichay」と呼ばれる需要ページングシステムを提案し、生産環境での実証を通じて、不要な情報の排除とページフォルト駆動のピン留めによりコンテキスト消費を最大 93% 削減可能であることを示しています。

Tony Mason2026-03-11🤖 cs.AI

Automating Detection and Root-Cause Analysis of Flaky Tests in Quantum Software

本論文は、LLM とコサイン類似度を活用した自動化パイプラインを開発し、量子ソフトウェアにおけるフラキーテストの検出と根本原因分析を効率化するとともに、既存データセットを 54% 拡大し、特に Google Gemini モデルが高精度な分類と原因特定を実現することを示しています。

Janakan Sivaloganathan, Ainaz Jamshidi, Andriy Miranskyy, Lei Zhang2026-03-11🤖 cs.AI

PlayWorld: Learning Robot World Models from Autonomous Play

この論文は、人間の成功に偏ったデモデータに依存せず、自律的なロボット自己遊戯から学習することで、物理的に一貫性のある高品質な動画世界モデルを構築し、実世界での政策性能を大幅に向上させる「PlayWorld」というシステムを提案しています。

Tenny Yin, Zhiting Mei, Zhonghe Zheng, Miyu Yamane, David Wang, Jade Sceats, Samuel M. Bateman, Lihan Zha, Apurva Badithela, Ola Shorinwa, Anirudha Majumdar2026-03-11🤖 cs.AI

WS-Net: Weak-Signal Representation Learning and Gated Abundance Reconstruction for Hyperspectral Unmixing via State-Space and Weak Signal Attention Fusion

この論文は、状態空間モデルと弱信号注意機構を統合した深層学習フレームワーク「WS-Net」を提案し、ハイパースペクトル画像の弱信号の崩壊を解決して、低 SNR 条件下でも主要なエンドメンバーと弱エンドメンバーの両方に対して高精度な豊度推定を実現することを示しています。

Zekun Long, Ali Zia, Guanyiman Fu, Vivien Rolland, Jun Zhou2026-03-11🤖 cs.AI

Time, Identity and Consciousness in Language Model Agents

この論文は、言語モデルエージェントの「安定した自己」としての振る舞いと、その背後にある組織化の整合性を区別し、Stack 理論に基づく時間的ギャップの概念を応用してアイデンティティ評価のための保守的なツールキットを提案するものである。

Elija Perrier, Michael Timothy Bennett2026-03-11🤖 cs.AI

EPOCH: An Agentic Protocol for Multi-Round System Optimization

この論文は、プロンプトやコード、機械学習システムなどの多様な環境における自律的な最適化を、基盤構築と反復的改善の 2 段階、および計画・実装・評価の役割分離ステージを通じて統一的に管理し、安定性と追跡可能性を確保する新しいエンジニアリングプロトコル「EPOCH」を提案しています。

Zhanlin Liu, Yitao Li, Munirathnam Srikanth2026-03-11🤖 cs.AI

From Days to Minutes: An Autonomous AI Agent Achieves Reliable Clinical Triage in Remote Patient Monitoring

この論文は、遠隔患者モニタリングで生成される膨大なデータを臨床スタッフが処理する課題を解決するため、自律型 AI エージェント「Sentinel」を開発し、従来の医師による監視を上回る感度とスケーラビリティで臨床的トリアージを可能にしたことを報告しています。

← 前へ次へ →

cs.AI