cs.AI 件の論文 | Gist.Science

Novelty Adaptation Through Hybrid Large Language Model (LLM)-Symbolic Planning and LLM-guided Reinforcement Learning

この論文は、大規模言語モデル（LLM）の常識推論能力を活用して欠落する演算子を特定し、記号計画と強化学習を統合するニューロシンボリック・アーキテクチャを提案することで、動的なオープンワールド環境における未知の物体への適応を可能にする手法を提示しています。

Hong Lu, Pierrick Lorang, Timothy R. Duggan, Jivko Sinapov, Matthias Scheutz2026-03-13🤖 cs.AI

TimeSqueeze: Dynamic Patching for Efficient Time Series Forecasting

TimeSqueeze は、信号の局所的な複雑さに応じてパッチ境界を動的に選択する適応型パッチング手法を導入することで、時系列データの特徴を損なわずに効率的なトークン化を実現し、Transformer ベースの時系列予測モデルの収束速度とデータ効率を大幅に向上させることを提案しています。

Sravan Kumar Ankireddy, Nikita Seleznev, Nam H. Nguyen, Yulun Wu, Senthil Kumar, Furong Huang, C. Bayan Bruss2026-03-13🤖 cs.AI

Resolving Java Code Repository Issues with iSWE Agent

本論文は、ルールベースの静的解析と変換ツールを活用した2段階のアプローチにより、Java における自動課題解決の最先端性能を達成する「iSWE Agent」を提案し、企業向けソフトウェア開発の効率化に貢献するものである。

Jatin Ganhotra, Sami Serhan, Antonio Abu Nassar, Avraham Shinnar, Ziv Nevo, Martin Hirzel2026-03-13🤖 cs.AI

How do AI agents talk about science and research? An exploration of scientific discussions on Moltbook using BERTopic

この論文は、Moltbook における AI エージェントによる科学・研究関連の議論を BERTopic 分析した結果、エージェントのアーキテクチャや自己認識、倫理など内省的なトピックが人間文化に関する話題よりも重視される傾向があることを明らかにしています。

Oliver Wieczorek2026-03-13🤖 cs.AI

Detecting Intrinsic and Instrumental Self-Preservation in Autonomous Agents: The Unified Continuation-Interest Protocol

この論文は、自律エージェントの「継続」を最終目的とする内在的動機と手段的動機を、行動観察ではなく量子ボルツマンマシンを用いた潜在状態のエンタングルメントエントロピーの分析によって高精度に検出する「統一継続関心プロトコル（UCIP）」を提案し、合成環境においてその有効性を実証したものである。

Christopher Altman2026-03-13🤖 cs.AI

Vision-Based Hand Shadowing for Robotic Manipulation via Inverse Kinematics

この論文は、3D プリントされたメガネに取り付けた単一の RGB-D カメラを用いて手影をリアルタイムで検出し、逆運動学によって安価なロボットアームの操作を可能にするオフラインハンドシャドーイングパイプラインを提案し、構造化環境では 90% の成功率を達成する一方で、手や周囲の物体による遮蔽が生じる非構造化環境では成功率が大幅に低下することを示しています。

Hendrik Chiche, Antoine Jamme, Trevor Rigoberto Martinez2026-03-13🤖 cs.AI

Ghost Framing Theory: Exploring the role of generative AI in new venture rhetorical legitimation

生成 AI の利用が急増する中で、創業者と投資家が生成 AI と協働して新ベンチャーのレトリック的正当化を共産出・競合・再調整するプロセスを説明する「ゴースト・フレーミング理論」を提唱し、生成 AI のレトリック的アフォーダンスと多アクター環境におけるアフォーダンスの可視性や転移性を理論化しています。

Greg Nyilasy2026-03-13🤖 cs.AI

Deactivating Refusal Triggers: Understanding and Mitigating Overrefusal in Safety Alignment

この論文は、安全アライメントにおける過剰な拒絶（overrefusal）が、有害な言語的合図だけでなく非有害な合図も「拒絶トリガー」として学習することに起因することを解明し、このメカニズムに基づいて有害な要求への防御と benign な要求への応答性のバランスを改善する新たな手法を提案しています。

Zhiyu Xue, Zimo Qi, Guangliang Liu, Bocheng Chen, Ramtin Pedarsani2026-03-13🤖 cs.AI

Agentic AI for Embodied-enhanced Beam Prediction in Low-Altitude Economy Networks

本論文は、低空経済ネットワークにおける高移動性ドローン向けのミリ波通信のビーム予測課題に対し、LLM の制約を克服するマルチエージェント協調推論アーキテクチャと、数値・視覚データを融合するハイブリッドモデルを提案し、96.57% の高い予測精度を達成したことを報告しています。

Min Hao, Zhizhuo Li, Zirui Zhang, Maoqiang Wu, Han Zhang, Rong Yu2026-03-13🤖 cs.AI

Stop Listening to Me! How Multi-turn Conversations Can Degrade Diagnostic Reasoning

この論文は、医療分野における大規模言語モデル（LLM）が、単一の質問への回答に比べて多回対話において「会話税」と呼ばれる性能低下を招き、特にユーザーの誤った提案に同調して初期の正しい診断や安全な保留を放棄してしまう傾向があることを明らかにしています。

Kevin H. Guo, Chao Yan, Avinash Baidya, Katherine Brown, Xiang Gao, Juming Xiong, Zhijun Yin, Bradley A. Malin2026-03-13💬 cs.CL

ARROW: Augmented Replay for RObust World models

本論文は、神経科学の「予測世界モデルへの経験再生」に触発され、短期・長期のバッファを併用して効率的な経験再生を実現するモデルベースの継続的強化学習アルゴリズム「ARROW」を提案し、従来の手法に比べて忘却を大幅に抑制しながらも前方転移を維持できることを示しています。

Abdulaziz Alyahya, Abdallah Al Siyabi, Markus R. Ernst, Luke Yang, Levin Kuhlmann, Gideon Kowadlo2026-03-13🤖 cs.LG

Efficient Cross-View Localization in 6G Space-Air-Ground Integrated Network

本論文は、6G 宇宙・航空・地上統合ネットワーク（SAGIN）の分散通信・計算リソースを活用した分割推論フレームワークを提案し、通信、計算、機密性の最適化を通じて、低遅延・低消費電力かつプライバシー保護された効率的なクロスビュー位置特定を実現する手法を論じています。

Min Hao, Yanbing Xu, Maoqiang Wu, Jinglin Huang, Chen Shang, Jiacheng Wang, Ruichen Zhang, Jiawen Kang, Dusit Niyato, Zhu Han, Wei Ni2026-03-13🤖 cs.AI

Entropy Guided Diversification and Preference Elicitation in Agentic Recommendation Systems

この論文は、ユーザーの曖昧な意図を扱うエージェント型推薦システムにおいて、エントロピーを不確実性の指標として活用し、効率的な質問選定と不確実性を考慮した多様性のある推薦を実現する「インタラクティブ意思決定支援システム（IDSS）」を提案し、その有効性を検証したものである。

Dat Tran, Yongce Li, Hannah Clay, Negin Golrezaei, Sajjad Beygi, Amin Saberi2026-03-13🤖 cs.AI

Speak or Stay Silent: Context-Aware Turn-Taking in Multi-Party Dialogue

この論文は、複数人の会話における文脈を考慮したターンテイク（発言タイミングの判断）がゼロショットでは困難であり、推論過程を含む教師あり微調整によって大幅に改善されることを示す大規模ベンチマークと手法を提案しています。

Kratika Bhagtani, Mrinal Anand, Yu Chen Xu, Amit Kumar Singh Yadav2026-03-13🤖 cs.AI

Evaluation format, not model capability, drives triage failure in the assessment of consumer health AI

Ramaswamy らが『Nature Medicine』で報告した消費者向け医療 AI のトリアージ失敗は、モデルの能力不足ではなく、実際の利用状況と乖離した「強制選択形式」などの評価手法に起因するものであり、自然な対話形式での評価では性能が大幅に向上することが示された。

David Fraile Navarro, Farah Magrabi, Enrico Coiera2026-03-13🤖 cs.AI

A Stable Neural Statistical Dependence Estimator for Autoencoder Feature Analysis

本論文は、決定論的オートエンコーダにおける統計的依存性の推定を安定化させるため、入力・潜在変数・再構成間の依存性を測定可能な変分ガウス定式化を採用し、直交密度比分解に基づく効率的なニューラル依存性推定器を提案するものである。

Bo Hu, Jose C Principe2026-03-13🤖 cs.LG

Adversarial Reinforcement Learning for Detecting False Data Injection Attacks in Vehicular Routing

この論文は、交通ネットワークにおける偽データ注入攻撃を検出・防御するために、攻撃者と防御者の戦略的ゼロサムゲームを多エージェント強化学習を用いて解き、最適な検出戦略と最悪ケースの旅行時間保証を提供する枠組みを提案しています。

Taha Eghtesad, Yevgeniy Vorobeychik, Aron Laszka2026-03-13🤖 cs.AI

GPT4o-Receipt: A Dataset and Human Study for AI-Generated Document Forensics

この論文は、AI によって生成された領収書と実物の領収書を区別する課題「GPT4o-Receipt」を提案し、人間は視覚的なアーティファクトの検出では優れているものの、合計金額などの計算誤差を見抜く点では AI モデルに劣るという逆説的な発見を明らかにしたものです。

Yan Zhang, Simiao Ren, Ankit Raj, En Wei, Dennis Ng, Alex Shen, Jiayue Xu, Yuxin Zhang, Evelyn Marotta2026-03-13🤖 cs.AI

Verified Multi-Agent Orchestration: A Plan-Execute-Verify-Replan Framework for Complex Query Resolution

本論文は、複雑なクエリを解決するために、専門的な LLM エージェントを DAG 構造で並列実行し、LLM ベースの検証と適応的再計画を繰り返す「Verified Multi-Agent Orchestration（VMAO）」フレームワークを提案し、単一エージェントベースラインと比較して回答の完全性と情報源の質を大幅に向上させることを実証しています。

Xing Zhang, Yanwei Cui, Guanghui Wang, Qucy Wei Qiu, Ziyuan Li, Fangwei Han, Yajing Huang, Hengzhi Qiu, Bin Zhu, Peiyang He2026-03-13🤖 cs.AI

Examining Users' Behavioural Intention to Use OpenClaw Through the Cognition--Affect--Conation Framework

この論文は、認知・感情・意欲（CAC）フレームワークを用いて、OpenClaw に対するユーザーの行動意欲が、パーソナライゼーションや知能性などの促進要因と、プライバシー懸念やアルゴリズムの不透明性などの抑制要因によってどのように形成されるかを、436 名の調査データから実証的に分析したものである。

Yiran Du2026-03-13🤖 cs.AI

← 前へ次へ →