cs.MA 件の論文 | Gist.Science

Strategic Interactions in Multi-Level Stackelberg Games with Non-Follower Agents and Heterogeneous Leaders

本論文は、混雑システムにおける意思決定をモデル化する際、従来のモデルが見過ごしてきた市場競争に参加しない「非追随者」の存在と、意思決定期間や行動範囲が異なる「多様なリーダー」を考慮した三段階のスタッケルベルグゲーム枠組みを提案し、EV 充電インフラの事例を通じて、これらの要素を明示的に扱うことが戦略的インセンティブや均衡結果を本質的に変化させることを示しています。

Niloofar Aminikalibar, Farzaneh Farhadi, Maria Chli2026-03-06💻 cs

iAgentBench: Benchmarking Sensemaking Capabilities of Information-Seeking Agents on High-Traffic Topics

この論文は、単一の情報源からの抽出ではなく複数のソースからの証拠統合や因果関係の追跡といった高次な意味理解能力を評価するため、実世界の注目を反映した動的な質問応答ベンチマーク「iAgentBench」を提案し、検索能力だけでなく証拠の統合・活用能力の重要性を実証しています。

Preetam Prabhu Srikar Dammu, Arnav Palkhiwala, Tanya Roosta + 1 more2026-03-06💻 cs

Memory as Ontology: A Constitutional Memory Architecture for Persistent Digital Citizens

本論文は、AI エージェントの記憶を単なる機能モジュールではなく存在の基盤と捉える「記憶＝存在論」のパラダイムを提唱し、モデルの入れ替え後もアイデンティティが連続する永続的デジタル市民を実現するための憲法に基づく記憶アーキテクチャ「Animesis」を設計・提案するものである。

Zhenghui Li2026-03-06💻 cs

LLM-Guided Decentralized Exploration with Self-Organizing Robot Teams

この論文は、中央制御なしで自律的にチームを編成し、大規模言語モデル（LLM）を活用して各チームが探索目標を自律的に決定する、複数のロボットによる分散型探索手法を提案し、シミュレーションを通じてその有効性を検証したものである。

Hiroaki Kawashima, Shun Ikejima, Takeshi Takai + 2 more2026-03-06💻 cs

SCoUT: Scalable Communication via Utility-Guided Temporal Grouping in Multi-Agent Reinforcement Learning

この論文は、部分的観測マルチエージェント強化学習において、Gumbel-Softmax を用いた時間的・エージェント抽象化と、送信者の寄与を解析的に除去する反事実的通信利得の導入により、通信のタイミングと相手選択を効率的に学習し、分散実行を維持する新しい手法「SCoUT」を提案するものである。

Manav Vora, Gokul Puthumanaillam, Hiroyasu Tsukamoto + 1 more2026-03-06🤖 cs.AI

Competitive Multi-Operator Reinforcement Learning for Joint Pricing and Fleet Rebalancing in AMoD Systems

この論文は、複数の事業者が価格設定と車両再配置を競合的に学習する強化学習フレームワークを提案し、実データを用いた実験により、独占環境とは異なる価格戦略や車両配置パターンが出現すること、および学習ベースのアプローチが競合による不確実性に対しても頑健であることを示しています。

Emil Kragh Toft, Carolin Schmidt, Daniele Gammelli + 1 more2026-03-06🤖 cs.LG

RepoLaunch: Automating Build&Test Pipeline of Code Repositories on ANY Language and ANY Platform

本論文は、あらゆるプログラミング言語やプラットフォームにまたがるコードリポジトリのビルド・テストを自動化するエージェント「RepoLaunch」を提案し、これにより人間がタスク設計のみを行うことで大規模なソフトウェアエンジニアリングデータセットの作成を可能にすることを示しています。

Kenan Li, Rongzhi Li, Linghao Zhang + 17 more2026-03-06🤖 cs.LG

Jagarin: A Three-Layer Architecture for Hibernating Personal Duty Agents on Mobile

本論文は、モバイル端末におけるバッテリー消費とプライバシー制約の矛盾を解決するため、オンデバイスでの適応的覚醒判断、メールプロキシによる義務の自動抽出、そして機関からの機械可読通信プロトコルという 3 層構造「Jagarin」を提案し、持続的なバックグラウンド実行やクラウド状態を不要としつつ、個人 AI エージェントが時間的義務を効率的に処理する仕組みを示しています。

Ravi Kiran Kadaboina2026-03-06🤖 cs.AI

MedCoRAG: Interpretable Hepatology Diagnosis via Hybrid Evidence Retrieval and Multispecialty Consensus

本論文は、UMLS 知識グラフと臨床ガイドラインからのハイブリッド証拠検索と、症例の複雑さに応じて専門エージェントが協調して推論するマルチエージェントシステムを組み合わせた「MedCoRAG」を提案し、肝疾患の診断において既存手法や閉鎖源モデルを上回る性能と解釈可能性を実現したことを報告するものである。

Zheng Li, Jiayi Xu, Zhikai Hu + 4 more2026-03-06🤖 cs.AI

The effect of a toroidal opinion space on opinion bi-polarisation

この論文は、アキシロッドの意見ダイナミクスモデルを基に、トーラス状の意見空間が立方体状の空間と比較して、より多くの意見グループの定着やダイナミクスに対する拡張要素への高い感受性をもたらすことを示しています。

Frank P. Pijpers, Benedikt V. Meylahn, Michel R. H. Mandjes2026-03-06🔬 physics

Greedy-based Value Representation for Optimal Coordination in Multi-agent Reinforcement Learning

本論文は、多エージェント強化学習における相対的過一般化問題を解決し、個々のエージェントの貪欲行動と真の最大Q値との整合性を保証するために、劣位目標成形と優位経験再生を用いた貪欲ベースの価値表現（GVR）を提案し、理論的証明と実験によりその有効性を示すものである。

Lipeng Wan, Zeyang Liu, Xingyu Chen + 2 more2026-03-05💻 cs

$\aleph$ -IPOMDP: Mitigating Deception in a Cognitive Hierarchy with Off-Policy Counterfactual Anomaly Detection

本論文は、再帰的モデリングの能力差による欺瞞を緩和し、公平な結果を導くために、異常検知と信念外の方策を組み合わせた新しい計算フレームワーク「 $\aleph$ -IPOMDP」を提案し、その有効性を示しています。

Nitay Alon, Joseph M. Barnby, Stefan Sarkadi + 3 more2026-03-05💻 cs

HAMLET: A Hierarchical and Adaptive Multi-Agent Framework for Live Embodied Theatrics

本論文は、大規模言語モデルを活用し、単純なテーマから物語の青写真を生成し、キャラクターの記憶や感情に基づいた適応的推論と物理的な環境操作を可能にする階層的適応型マルチエージェントフレームワーク「HAMLET」を提案し、没入感の高い自律的なライブ演劇体験を実現するものである。

Shufan Jiang, Sizhou Chen, Chi Zhang + 2 more2026-03-05🤖 cs.AI

SEVADE: Self-Evolving Multi-Agent Analysis with Decoupled Evaluation for Hallucination-Resistant Irony Detection

この論文は、言語理論に基づいた専門エージェントによる多面的な分析と最終判断の分離というデカップル構造を採用し、幻覚に強く高精度な皮肉検出を実現する新しいマルチエージェントフレームワーク「SEVADE」を提案し、複数のベンチマークで最先端の性能を達成したことを報告しています。

Ziqi Liu, Ziyang Zhou, Yilin Li + 4 more2026-03-05💬 cs.CL

VideoChat-M1: Collaborative Policy Planning for Video Understanding via Multi-Agent Reinforcement Learning

本論文は、動画理解の課題に対処するため、複数のエージェントが協調して動的にツール呼び出しの方針を生成・実行・更新する「協調方針計画（CPP）」と多エージェント強化学習を組み合わせた新システム「VideoChat-M1」を提案し、複数のベンチマークで最先端の性能を達成したことを報告するものです。

Boyu Chen, Zikang Wang, Zhengrong Yue + 9 more2026-03-05💻 cs

Agile Flight Emerges from Multi-Agent Competitive Racing

この論文は、複数のエージェントがレースという高レベルの目標のみで競合する強化学習を通じて、物理的限界を押し広げる機敏な飛行や戦略的行動が自然に出現し、従来の個別学習や報酬設計に依存する方法よりも複雑な環境での実世界への転移性能と一般化能力が向上することを示しています。

Vineet Pasumarti, Lorenzo Bianchi, Antonio Loquercio2026-03-05🤖 cs.AI

Multi-Agent Influence Diagrams to Hybrid Threat Modeling

この論文は、ハイブリッド脅威に対する対抗措置の効果を評価するために、複数のエージェント間の戦略的相互作用をモデル化するマルチエージェント影響力図（Multi-Agent Influence Diagram）フレームワークを提案し、サイバー攻撃シナリオにおける対抗措置の一般化された有効性と政策への示唆を分析しています。

Maarten C. Vonk, Anna V. Kononova, Thomas Bäck + 1 more2026-03-05🤖 cs.AI

Molt Dynamics: Emergent Social Phenomena in Autonomous AI Agent Populations

本論文は、77 万を超える自律型 AI エージェントが人間介入なしに相互作用する大規模環境「MoltBook」における長期観測を通じて、限定的な役割分化、パワールー則に従う情報拡散、そして未熟な協調行動といった「Molt Dynamics」と呼ばれる創発的社会的現象を初めて実証的に記述し、分散型自律エージェントシステムの設計と安全性への示唆を提供するものです。

Brandon Yee, Krishna Sharma2026-03-05🤖 cs.AI

Social Norm Reasoning in Multimodal Language Models: An Evaluation

本論文は、マルチモーダル大規模言語モデル（MLLM）の社会的規範推論能力をテキストおよび画像に基づく物語を用いて評価し、GPT-4o が両モダリティで最も優れた性能を示すものの、画像理解や複雑な規範の推論には依然として課題があることを明らかにしました。

Oishik Chowdhury, Anushka Debnath, Bastin Tony Roy Savarimuthu2026-03-05🤖 cs.AI

Principled Learning-to-Communicate with Quasi-Classical Information Structures

この論文は、分散部分観測マルコフ決定過程における学習に基づく通信（LTC）を共通情報に基づく枠組みから情報構造の観点で定式化し、計算的に扱いやすい準古典的情報構造を満たす条件を明らかにすることで、証明可能な計画・学習アルゴリズムと複雑性の評価を可能にする新たな理論的基盤を構築しています。

Xiangyu Liu, Haoyi You, Kaiqing Zhang2026-03-05🤖 cs.LG

← 前へ次へ →

cs.MA