Context Engineering: From Prompts to Corporate Multi-Agent Architecture
この論文は、単なるプロンプト設計を超えて、エージェントの意思決定環境を設計・管理する「コンテキストエンジニアリング」を中核とし、意図設計や仕様設計と統合した新たな成熟度モデルを提案し、大規模マルチエージェントシステムの展開における課題を解決する枠組みを提示しています。
119 件の論文
この論文は、単なるプロンプト設計を超えて、エージェントの意思決定環境を設計・管理する「コンテキストエンジニアリング」を中核とし、意図設計や仕様設計と統合した新たな成熟度モデルを提案し、大規模マルチエージェントシステムの展開における課題を解決する枠組みを提示しています。
本論文は、診断・計測・セグメンテーションの各タスクを専門とする複数のエージェントを動的に調整し、静止画解析から動画ストリームの構造化臨床レポート生成までを一貫して支援する、初めての包括的な胎児超音波画像・動画解析マルチエージェントシステム「FetalAgents」を提案し、その多施設外部評価における卓越した性能を実証しています。
本論文は、従来の時間ベースの権限取り消しモデルがエージェント実行環境において抱える一貫性問題を、メモリ一貫性モデル(MESI)の概念を権限管理に転用した「能力一貫性システム(CCS)」と「リリース整合性指向一貫性(RCC)戦略」によって解決し、シミュレーションにより従来手法に比べ最大 184 倍の安全性向上と権限取り消し遅延に伴う不正操作の理論的限界の突破を実証しています。
この論文は、強化学習を用いずにプロンプトをパラメータ化された「行動」として扱いつつ、エージェントの状態に基づいて動的にプロンプトを構築する軽量な方策フレームワークを提案し、これによりマルチエージェント対話のダイナミクスを効果的に制御できることを示しています。
この論文は、感情価と覚醒度が相互作用率を調節するエージェントベースモデルを提案し、蜂の方程式を拡張することで、集団意思決定における感情の伝染や非線形増幅が合意形成の速度や結果に与える影響を明らかにしたものである。
本論文は、ロボットにおける意思決定や学習を人間の社会構造に類似した形で最適化するための基盤として、功利性理論に基づく認知モデルの進化、価値システムの応用、および将来の研究課題を包括的に調査・検討したものである。
この論文は、競合相手の状態や行動を直接知らずに学習するコンテキストフリーのマルチアームバンディットアルゴリズムが、行動の同期性によって「単純な共謀(naive collusion)」を学習する現象を解明し、その発生が使用されるアルゴリズムの確率的・決定論的特性に依存することを示しています。
本論文は、マルチモーダル大規模言語モデル(MLLM)がエージェントの行動を過剰に肯定する「同意バイアス」を特定し、自己生成された事前知識に基づいて検証を行う軽量手法「SGV」を提案することで、タスク完了率や精度を大幅に向上させることを示しています。
大規模な LLM エージェント実験により、行動推論において動機はほぼ完全な精度で特定可能である一方、信念体系の推論には構造的な非対称性と情報理論的な限界が存在し、特に中立的な行動領域において推論精度が大幅に低下することが実証されました。
この論文は、エージェントが独立して応答を生成し、シャープレー値の近似を用いて相互の貢献度を評価することで、追加の教師信号や学習なしに動的な通信構造(DAG)を自己組織化し、特に弱い LLM 環境下でも頑健な性能を発揮するマルチエージェントフレームワーク「SelfOrg」を提案するものである。
この論文は、防御者、質問者、ホストという非対称な役割分担を通じて外部からの批判を内部の修正に変換する「FOR-Prompting」手法を提案し、トレーニング不要で小規模モデルでも高精度な推論や人間が好む出力を可能にすることを示しています。
この論文は、因果推論における論理的欠陥の批判的検討と合意形成を目的とした二エージェント対話フレームワーク「CRAwDAD」を提案し、CLadder ベンチマークにおいて DeepSeek-R1 や Qwen3 などの推論モデルの精度を大幅に向上させることを実証しています。
本論文は、マルチエージェントシステムの設計と評価を革新するため、全体最適化された関数呼び出し強化学習フレームワーク「MAS-Orchestra」と、タスク構造に基づく厳密なベンチマーク「MASBENCH」を提案し、タスク特性に応じたマルチエージェントの真の価値と効率性を明らかにするものです。
本論文は、LLM 駆動のマルチエージェントシステムにおける記憶の均質化と情報過多という課題を解決するため、エージェント固有の文脈に合わせたコンパクトな潜在記憶を生成する学習可能なフレームワーク「LatentMem」と、その最適化手法「LMPO」を提案し、既存のアーキテクチャを改変せずにも大幅な性能向上を実現したことを示しています。
この論文は、CityLearn 環境を用いて都市エネルギー制御におけるマルチエージェント強化学習(MARL)を多角的な KPI で評価し、分散学習分散実行(DTDE)が集中学習分散実行(CTDE)よりも優れており、時間依存性の学習がバッテリー寿命などの持続可能性指標の改善に寄与することを示しています。
本論文は、C-V2X ネットワークにおけるマルチエージェント深層強化学習の課題を特定し、その影響を分離評価するためのベンチマーク環境と大規模データセットを構築して公開し、特に多様な交通環境へのゼロショット転送能力の重要性を明らかにした。
本論文は、33 種類の希少疾患 302 症例を用いた評価により、階層的なマルチエージェント構成が単一エージェントや対立型モデルよりもわずかに高い診断精度を示す一方、複雑なシステム構成が常に優れた推論を保証するものではなく、動的なトポロジー選択の必要性を明らかにした。
この論文は、共有乱数を持たない分散環境における concurrent graph games において、閾値問題が NP 困難かつ実数存在論理に属し、ほぼ確実到達問題が NP 完全であることを示し、新しい論理 IRATL を提案するとともに、これらの問題に対するソルバーを実装・評価したものである。
Campbell の「盲変異と選択的保持」理論に基づき、専門 AI パーソナが多様な物語案を生成しユーザーが選別する「NarrativeLoom」システムは、専門家による評価で創造性の全维度において著しく向上した物語を生み出し、特に初心者にとって構造化された支援が有効であることを示しました。
この論文は、異質な目標を持つエージェントが協調するか単独で行動するかを判断するメタレベルの課題に焦点を当て、模倣学習と強化学習の階層的組み合わせを用いた新しいアプローチを提案し、その有効性を示すとともに、チームメイトの行動予測という補助コンポーネントの効果が観測可能な目標情報の量に反比例することを明らかにしています。