cs.AI 件の論文 | Gist.Science

Uncovering a Winning Lottery Ticket with Continuously Relaxed Bernoulli Gates

本論文は、非微分可能なスコアベースの選択に依存する既存手法の限界を克服し、連続的に緩和されたベルヌーイゲートを用いて重みを固定したまま勾配降下法で最適化を行うことで、強 Lottery チケットを効率的に発見し、Edge-Popup 手法の約 2 倍のスパース化を達成する初の完全微分可能なアプローチを提案するものである。

Itamar Tsayag, Ofir LindenbaumWed, 11 Ma🤖 cs.AI

Quantifying Uncertainty in AI Visibility: A Statistical Framework for Generative Search Measurement

この論文は、生成 AI 検索におけるドメインの可視性を単一の点推定値として扱う従来の手法の限界を指摘し、回答の非決定性を反映して引用分布のばらつきを統計的に定量化し、信頼区間付きの指標と適切なサンプリング手法の必要性を提唱するものである。

Ronald SielinskiWed, 11 Ma🤖 cs.AI

Using Vision Language Foundation Models to Generate Plant Simulation Configurations via In-Context Learning

この論文は、ドローン画像から植物シミュレーションの構成パラメータを生成するために、コンテキスト学習を活用したビジョン言語モデル（VLM）を初めて導入し、合成データと実世界のデータを用いてその性能と限界を評価した研究です。

Heesup Yun, Isaac Kazuo Uyehara, Earl Ranario, Lars Lundqvist, Christine H. Diepenbrock, Brian N. Bailey, J. Mason EarlesWed, 11 Ma🤖 cs.AI

Interpretable Markov-Based Spatiotemporal Risk Surfaces for Missing-Child Search Planning with Reinforcement Learning and LLM-Based Quality Assurance

この論文は、マルコフ連鎖、強化学習、LLM を組み合わせた 3 層アーキテクチャを採用し、行方不明児童の捜索計画において、構造化されていないデータから解釈可能な時空間リスク予測と最適化された捜索計画を生成する意思決定支援システム「Guardian」を提案し、その有効性を検証したものである。

Joshua Castillo, Ravi MukkamalaWed, 11 Ma🤖 cs.AI

PathoScribe: Transforming Pathology Data into a Living Library with a Unified LLM-Driven Framework for Semantic Retrieval and Clinical Integration

本論文は、自然言語による症例検索、自動コホート構築、臨床質問応答などを統合した大規模言語モデル駆動型の「PathoScribe」フレームワークを提案し、7 万件の病理報告データを用いた評価において、従来の手動レビューに比べて時間とコストを劇的に削減しつつ、高い精度で臨床意思決定を支援できることを実証したものである。

Abdul Rehman Akbar, Samuel Wales-McGrath, Alejadro Levya, Lina Gokhale, Rajendra Singh, Wei Chen, Anil Parwani, Muhammad Khalid Khan NiaziWed, 11 Ma🤖 cs.AI

VoxEmo: Benchmarking Speech Emotion Recognition with Speech LLMs

この論文は、ゼロショット推論におけるプロンプトの感度や感情の曖昧さといった課題を克服し、35 のコーパスと 15 言語にわたる包括的な評価基準「VoxEmo」を提案することで、音声 LLM による感情認識の標準化と人間の主観的分布への整合性を可能にする研究です。

Hezhao Zhang, Huang-Cheng Chou, Shrikanth Narayanan, Thomas HainWed, 11 Ma🤖 cs.AI

AgentOS: From Application Silos to a Natural Language-Driven Data Ecosystem

本論文は、従来の GUI/CLI ベースの OS と AI エージェントの間のアーキテクチャ的ミスマッチを解消し、自然言語を中核とした「エージェント OS（AgentOS）」を提案するとともに、その実現を意図マイニングや知識発見などのデータマイニング課題として捉え、KDD 分野における新たな研究課題を提示するものである。

Rui Liu, Tao Zhe, Dongjie Wang, Zijun Yao, Kunpeng Liu, Yanjie Fu, Huan Liu, Jian PeiWed, 11 Ma🤖 cs.AI

BiCLIP: Domain Canonicalization via Structured Geometric Transformation

本論文は、異なるドメイン間の画像特徴が少数のアンカーを用いて復元可能な幾何学的変換によって関連付けられているという仮説に基づき、極めてシンプルかつパラメータ効率の高い BiCLIP というフレームワークを提案し、11 のベンチマークで最先端のドメイン適応性能を達成したことを報告しています。

Pranav Mantini, Shishir K. ShahWed, 11 Ma🤖 cs.AI

A Consensus-Driven Multi-LLM Pipeline for Missing-Person Investigations

この論文は、欠落者捜査の最初の 72 時間を支援し、複数のタスク特化型 LLM と合意形成エンジン、そして QLoRA 微調整を組み合わせることで、信頼性の高い構造化情報抽出を実現する「Guardian」というエンドツーエンドシステムを提案しています。

Joshua Castillo, Ravi MukkamalaWed, 11 Ma🤖 cs.AI

Automated Tensor-Relational Decomposition for Large-Scale Sparse Tensor Computation

この論文は、大規模な疎テンソル計算において、計算集約的な部分を効率的な数値カーネルで実行し、疎性をリレーショナルシステムで管理できるよう、古典的なアインシュタインの総和記法をテンソル関係計算向けに拡張した「EinSum」を提案し、その自動書き換え手法を研究するものである。

Yuxin Tang, Zhiyuan Xin, Zhimin Ding, Xinyu Yao, Daniel Bourgeois, Tirthak Patel, Chris JermaineWed, 11 Ma🤖 cs.AI

The FABRIC Strategy for Verifying Neural Feedback Systems

本論文は、ニューラルネットワーク制御システムにおける従来の前方到達集合解析の限界を補完し、非線形ニューラルフィードバックシステムに対する後方到達集合の過大・過小近似を計算する新アルゴリズムと、それらを統合した「FaBRIC」と呼ばれる検証手法を提案し、ベンチマーク評価において先行研究を大幅に上回る性能を実証したものである。

I. Samuel Akinwande, Sydney M. Katz, Mykel J. Kochenderfer, Clark BarrettWed, 11 Ma🤖 cs.AI

Semantic Level of Detail: Multi-Scale Knowledge Representation via Heat Kernel Diffusion on Hyperbolic Manifolds

本論文は、双曲多様体上の熱核拡散を用いた連続的なズーム操作「Semantic Level of Detail (SLoD)」を提案し、グラフラプラシアンのスペクトルギャップから知識グラフの抽象化レベルを自動的に検出する手法を確立したものである。

Edward IzgorodinWed, 11 Ma🤖 cs.AI

Arbiter: Detecting Interference in LLM Agent System Prompts

本論文は、LLM ベースのコーディングエージェントのシステムプロンプトにおける干渉パターンを検出するフレームワーク「Arbiter」を提案し、主要なベンダーのプロンプトに多数の脆弱性を発見し、プロンプト構造と失敗クラスの相関やマルチモデル評価の重要性を実証した。

Tony MasonWed, 11 Ma🤖 cs.AI

Security Considerations for Multi-agent Systems

本論文は、自律エージェント間の協調によって生じる新たなセキュリティ脅威を体系的に分析し、既存の 16 のセキュリティフレームワークを評価した結果、どのフレームワークも包括的な対策を欠いており、特に OWASP のイニシアチブや CDAO のツールキットが相対的に優れていることを実証的に示しています。

Tam Nguyen, Moses Ndebugre, Dheeraj ArremsettyWed, 11 Ma🤖 cs.AI

Gender Fairness in Audio Deepfake Detection: Performance and Disparity Analysis

本論文は、ASVspoof 5 データセットを用いた音声ディープフェイク検出モデルの分析を通じて、従来の総合誤り率だけでは隠れてしまう性別による性能偏在を公平性指標で明らかにし、より公平で信頼性の高いシステム構築には公平性重視の評価が不可欠であることを示しています。

Aishwarya Fursule, Shruti Kshirsagar, Anderson R. AvilaWed, 11 Ma🤖 cs.AI

Improving through Interaction: Searching Behavioral Representation Spaces with CMA-ES-IG

この論文は、ロボットの行動表現空間を探索する際に、ユーザーの体験を考慮して知覚的に明確で情報量の多い軌道を提案する「CMA-ES-IG」というアルゴリズムを提案し、高次元空間でのスケーラビリティ、計算効率、ノイズへの頑健性、および非専門家ユーザーによる評価の向上を実験的に実証したものである。

Nathaniel Dennler, Zhonghao Shi, Yiran Tao, Andreea Bobu, Stefanos Nikolaidis, Maja MataricWed, 11 Ma🤖 cs.AI

Meissa: Multi-modal Medical Agentic Intelligence

API 依存の医療 AI が抱えるコストやプライバシー課題を解決するため、最先端モデルから戦略的行動を蒸留した軽量な 40 億パラメータのマルチモーダル医療エージェント「Meissa」を提案し、オフライン環境で最先端モデルに匹敵する性能と大幅な低遅延を実現したことを示しています。

Yixiong Chen, Xinyi Bai, Yue Pan, Zongwei Zhou, Alan YuilleWed, 11 Ma🤖 cs.AI

AI Phenomenology for Understanding Human-AI Experiences Across Eras

この論文は、従来の評価指標では捉えきれない人間と AI の複雑な体験を「AI 現象学」という枠組みで理解し、ユーザーの第一人称の感覚を重視する研究方法論、設計概念、および研究課題を提示しています。

Bhada Yun, Evgenia Taranova, Dana Feng, Renn Su, April Yi WangWed, 11 Ma🤖 cs.AI

MEMO: Memory-Augmented Model Context Optimization for Robust Multi-Turn Multi-Agent LLM Games

この論文は、マルチターン・マルチエージェント LLM ゲームにおける推論時のコンテキストを、自己対戦から得られた構造化された知見を保持する「保持」と、不確実性を考慮したプロンプト進化を行う「探索」を組み合わせる MEMO というフレームワークで最適化することで、勝率の向上と結果の安定化を実現することを提案しています。

Yunfei Xie, Kevin Wang, Bobby Cheng, Jianzhu Yao, Zhizhou Sha, Alexander Duffy, Yihan Xi, Hongyuan Mei, Cheston Tan, Chen Wei, Pramod Viswanath, Zhangyang WangWed, 11 Ma🤖 cs.AI

The Missing Memory Hierarchy: Demand Paging for LLM Context Windows

この論文は、LLM のコンテキストウィンドウを単なるキャッシュではなく、仮想メモリとして扱う「Pichay」と呼ばれる需要ページングシステムを提案し、生産環境での実証を通じて、不要な情報の排除とページフォルト駆動のピン留めによりコンテキスト消費を最大 93% 削減可能であることを示しています。

Tony MasonWed, 11 Ma🤖 cs.AI

← 前へ次へ →