Uncovering a Winning Lottery Ticket with Continuously Relaxed Bernoulli Gates

本論文は、非微分可能なスコアベースの選択に依存する既存手法の限界を克服し、連続的に緩和されたベルヌーイゲートを用いて重みを固定したまま勾配降下法で最適化を行うことで、強 Lottery チケットを効率的に発見し、Edge-Popup 手法の約 2 倍のスパース化を達成する初の完全微分可能なアプローチを提案するものである。

Itamar Tsayag, Ofir LindenbaumWed, 11 Ma🤖 cs.AI

Using Vision Language Foundation Models to Generate Plant Simulation Configurations via In-Context Learning

この論文は、ドローン画像から植物シミュレーションの構成パラメータを生成するために、コンテキスト学習を活用したビジョン言語モデル(VLM)を初めて導入し、合成データと実世界のデータを用いてその性能と限界を評価した研究です。

Heesup Yun, Isaac Kazuo Uyehara, Earl Ranario, Lars Lundqvist, Christine H. Diepenbrock, Brian N. Bailey, J. Mason EarlesWed, 11 Ma🤖 cs.AI

Interpretable Markov-Based Spatiotemporal Risk Surfaces for Missing-Child Search Planning with Reinforcement Learning and LLM-Based Quality Assurance

この論文は、マルコフ連鎖、強化学習、LLM を組み合わせた 3 層アーキテクチャを採用し、行方不明児童の捜索計画において、構造化されていないデータから解釈可能な時空間リスク予測と最適化された捜索計画を生成する意思決定支援システム「Guardian」を提案し、その有効性を検証したものである。

Joshua Castillo, Ravi MukkamalaWed, 11 Ma🤖 cs.AI

PathoScribe: Transforming Pathology Data into a Living Library with a Unified LLM-Driven Framework for Semantic Retrieval and Clinical Integration

本論文は、自然言語による症例検索、自動コホート構築、臨床質問応答などを統合した大規模言語モデル駆動型の「PathoScribe」フレームワークを提案し、7 万件の病理報告データを用いた評価において、従来の手動レビューに比べて時間とコストを劇的に削減しつつ、高い精度で臨床意思決定を支援できることを実証したものである。

Abdul Rehman Akbar, Samuel Wales-McGrath, Alejadro Levya, Lina Gokhale, Rajendra Singh, Wei Chen, Anil Parwani, Muhammad Khalid Khan NiaziWed, 11 Ma🤖 cs.AI

VoxEmo: Benchmarking Speech Emotion Recognition with Speech LLMs

この論文は、ゼロショット推論におけるプロンプトの感度や感情の曖昧さといった課題を克服し、35 のコーパスと 15 言語にわたる包括的な評価基準「VoxEmo」を提案することで、音声 LLM による感情認識の標準化と人間の主観的分布への整合性を可能にする研究です。

Hezhao Zhang, Huang-Cheng Chou, Shrikanth Narayanan, Thomas HainWed, 11 Ma🤖 cs.AI

AgentOS: From Application Silos to a Natural Language-Driven Data Ecosystem

本論文は、従来の GUI/CLI ベースの OS と AI エージェントの間のアーキテクチャ的ミスマッチを解消し、自然言語を中核とした「エージェント OS(AgentOS)」を提案するとともに、その実現を意図マイニングや知識発見などのデータマイニング課題として捉え、KDD 分野における新たな研究課題を提示するものである。

Rui Liu, Tao Zhe, Dongjie Wang, Zijun Yao, Kunpeng Liu, Yanjie Fu, Huan Liu, Jian PeiWed, 11 Ma🤖 cs.AI

BiCLIP: Domain Canonicalization via Structured Geometric Transformation

本論文は、異なるドメイン間の画像特徴が少数のアンカーを用いて復元可能な幾何学的変換によって関連付けられているという仮説に基づき、極めてシンプルかつパラメータ効率の高い BiCLIP というフレームワークを提案し、11 のベンチマークで最先端のドメイン適応性能を達成したことを報告しています。

Pranav Mantini, Shishir K. ShahWed, 11 Ma🤖 cs.AI

Automated Tensor-Relational Decomposition for Large-Scale Sparse Tensor Computation

この論文は、大規模な疎テンソル計算において、計算集約的な部分を効率的な数値カーネルで実行し、疎性をリレーショナルシステムで管理できるよう、古典的なアインシュタインの総和記法をテンソル関係計算向けに拡張した「EinSum」を提案し、その自動書き換え手法を研究するものである。

Yuxin Tang, Zhiyuan Xin, Zhimin Ding, Xinyu Yao, Daniel Bourgeois, Tirthak Patel, Chris JermaineWed, 11 Ma🤖 cs.AI

The FABRIC Strategy for Verifying Neural Feedback Systems

本論文は、ニューラルネットワーク制御システムにおける従来の前方到達集合解析の限界を補完し、非線形ニューラルフィードバックシステムに対する後方到達集合の過大・過小近似を計算する新アルゴリズムと、それらを統合した「FaBRIC」と呼ばれる検証手法を提案し、ベンチマーク評価において先行研究を大幅に上回る性能を実証したものである。

I. Samuel Akinwande, Sydney M. Katz, Mykel J. Kochenderfer, Clark BarrettWed, 11 Ma🤖 cs.AI

Security Considerations for Multi-agent Systems

本論文は、自律エージェント間の協調によって生じる新たなセキュリティ脅威を体系的に分析し、既存の 16 のセキュリティフレームワークを評価した結果、どのフレームワークも包括的な対策を欠いており、特に OWASP のイニシアチブや CDAO のツールキットが相対的に優れていることを実証的に示しています。

Tam Nguyen, Moses Ndebugre, Dheeraj ArremsettyWed, 11 Ma🤖 cs.AI

Gender Fairness in Audio Deepfake Detection: Performance and Disparity Analysis

本論文は、ASVspoof 5 データセットを用いた音声ディープフェイク検出モデルの分析を通じて、従来の総合誤り率だけでは隠れてしまう性別による性能偏在を公平性指標で明らかにし、より公平で信頼性の高いシステム構築には公平性重視の評価が不可欠であることを示しています。

Aishwarya Fursule, Shruti Kshirsagar, Anderson R. AvilaWed, 11 Ma🤖 cs.AI

Improving through Interaction: Searching Behavioral Representation Spaces with CMA-ES-IG

この論文は、ロボットの行動表現空間を探索する際に、ユーザーの体験を考慮して知覚的に明確で情報量の多い軌道を提案する「CMA-ES-IG」というアルゴリズムを提案し、高次元空間でのスケーラビリティ、計算効率、ノイズへの頑健性、および非専門家ユーザーによる評価の向上を実験的に実証したものである。

Nathaniel Dennler, Zhonghao Shi, Yiran Tao, Andreea Bobu, Stefanos Nikolaidis, Maja MataricWed, 11 Ma🤖 cs.AI

Meissa: Multi-modal Medical Agentic Intelligence

API 依存の医療 AI が抱えるコストやプライバシー課題を解決するため、最先端モデルから戦略的行動を蒸留した軽量な 40 億パラメータのマルチモーダル医療エージェント「Meissa」を提案し、オフライン環境で最先端モデルに匹敵する性能と大幅な低遅延を実現したことを示しています。

Yixiong Chen, Xinyi Bai, Yue Pan, Zongwei Zhou, Alan YuilleWed, 11 Ma🤖 cs.AI

MEMO: Memory-Augmented Model Context Optimization for Robust Multi-Turn Multi-Agent LLM Games

この論文は、マルチターン・マルチエージェント LLM ゲームにおける推論時のコンテキストを、自己対戦から得られた構造化された知見を保持する「保持」と、不確実性を考慮したプロンプト進化を行う「探索」を組み合わせる MEMO というフレームワークで最適化することで、勝率の向上と結果の安定化を実現することを提案しています。

Yunfei Xie, Kevin Wang, Bobby Cheng, Jianzhu Yao, Zhizhou Sha, Alexander Duffy, Yihan Xi, Hongyuan Mei, Cheston Tan, Chen Wei, Pramod Viswanath, Zhangyang WangWed, 11 Ma🤖 cs.AI

The Missing Memory Hierarchy: Demand Paging for LLM Context Windows

この論文は、LLM のコンテキストウィンドウを単なるキャッシュではなく、仮想メモリとして扱う「Pichay」と呼ばれる需要ページングシステムを提案し、生産環境での実証を通じて、不要な情報の排除とページフォルト駆動のピン留めによりコンテキスト消費を最大 93% 削減可能であることを示しています。

Tony MasonWed, 11 Ma🤖 cs.AI