TeamHOI: Learning a Unified Policy for Cooperative Human-Object Interactions with Any Team Size
TeamHOI は、Transformer ベースのアーキテクチャとマスクされた敵対的運動事前知識(AMP)戦略を活用することで、単一の分散型方策により、チームサイズや対象物の形状に関わらず、物理的に現実的な協調的な人間 - 物体相互作用を実現するフレームワークです。
123 件の論文
TeamHOI は、Transformer ベースのアーキテクチャとマスクされた敵対的運動事前知識(AMP)戦略を活用することで、単一の分散型方策により、チームサイズや対象物の形状に関わらず、物理的に現実的な協調的な人間 - 物体相互作用を実現するフレームワークです。
この論文は、気候変動、漁労努力、社会経済的要因を統合したマルチエージェントモデルを用いて、セネガルの沿岸漁業の動態と漁師の移動をシミュレーションし、過剰な漁労努力が漁業崩壊と大規模な移住を招く一方、漁労努力の削減と気候変動の影響の比較的小ささが持続可能な漁業均衡を可能にすることを示しています。
本論文は、通信遅延や観測の不完全性といった課題に直面する非対称な 3 次元追跡・逃走タスクにおいて、エージェント間の冗長な通信チャネルを排除し、観測次元の削減と局所性に基づくクレジット割り当て(CGCA)を導入することで、通信なしの協調制御の頑健性と成功率を向上させる「少即是多」のパラダイムを実証しています。
本論文は、デスクトップ UI、多様な API、ローカルおよびクラウドモデル、持続的メモリ、タスクスケジューリング、MCP 互換性などを統合したユニファイド・オーケストレーションコアを中核とし、計画と実行を分離する 3 フェーズパイプラインや適応的なモデル管理、高度なツールルーティングを備えた汎用 AI アシスタントプラットフォーム「IronEngine」のアーキテクチャ、設計、性能、および他システムとの比較分析を提示するものである。
本論文は、大規模言語モデルや他のニューラルネットワークを自然言語で対話させる「マインドストーム」を通じて単一モデルの限界を克服する「自然言語ベースの社会の心(NLSOM)」の概念を提唱し、その実証実験と、将来的な大規模異種エージェント社会の構造や経済原理に関する新たな研究課題を議論しています。
この論文は、分散型環境におけるエージェント間の戦略的相互作用をより正確に理解するために、第三者が他者の目的を完全に知っているという従来の仮定を越え、各エージェントが他者の目的をどのように推定しているかを推論する「レベル 2 逆ゲーム」の枠組みを提案し、その非凸性を証明するとともに効率的な解法を開発したものである。
ゼロショット協調(ZSC)における既存のベンチマークである Hanabi 学習環境の限界を克服し、移動するカードの信念追跡や曖昧なヒントの推論など、より高度な協調能力を評価するための新たなオープンソースベンチマーク「Yokai 学習環境(YLE)」を提案し、HLE で最高性能を達成した手法が YLE では性能が低下することを示すことで、単一のベンチマークでの進捗が一般化しないことを実証した。
この論文は、リーダー・フォロワー相互作用に因果階層を組み込んだ逐次因果ゲームの理論的枠組みを提案するものの、シミュレーションを通じて合理的な後方帰納法では古典的なスタッケルベルグ均衡に対して福利の改善が全く見られず、因果的推論の利点が標準的な均衡概念では実現できないという重要な限界を明らかにしています。
本論文は、LLM ワークフローを「LLM プログラム」として抽象化し、KV キャッシュのヒット率向上やメモリ不均衡の解消、非同期な環境準備を可能にするプログラム意識型のスケジューラとツールリソースマネージャーを備えた高速でシンプルな推論システム「ThunderAgent」を提案し、既存システムと比較してスループットやディスクメモリ効率を大幅に改善することを示しています。
この論文は、LLM ベースのマルチエージェントシステムのメモリ要件をコンピュータアーキテクチャの観点から再定義し、共有・分散メモリのパラダイムや階層構造を提案するとともに、特にエージェント間でのメモリ整合性という課題の解決が信頼性のあるスケーラブルなシステム構築の鍵であると論じています。
この論文は、LLM の暗黙的なヒューリスティックに代わって知識駆動型の専門スキルと双層メモリ機構を採用したマルチエージェントフレームワーク「KernelSkill」を提案し、GPU カーネル最適化において既存手法を上回る高い成功率と高速化を実現したことを報告しています。
本論文は、グリッド、ロードマップ、連続空間など異なる抽象化レベルの環境で同一タスクを評価可能にする統合された2Dマルチロボット経路計画シミュレータおよびベンチマーク「GRACE」を提案し、表現と忠実度のトレードオフを定量化することで研究の比較可能性と実用化を促進するものです。
本論文は、LLM を活用したマルチエージェントフレームワーク「LLMGreenRec」を提案し、ユーザーの持続可能な購買意図を推論して環境に配慮した製品を推薦すると同時に、システム自体のデジタル炭素フットプリントも削減する手法を確立したものである。
この論文は、YouTube のコメディ動画から学習した LLM 批評家と制作スタジオの役割を模倣したエージェント群を用いて、 iteratively な競争と評価を通じて SNL などのスケッチショーに匹敵する高品質なコメディ動画を自動生成する AI システム「COMIC」を提案しています。
この論文は、GNSS やデータ共有が制限された拒否環境において、動物のような嗅覚・聴覚シグナルを活用した「OA-Bug」アルゴリズムを提案し、シミュレーションおよび実機実験を通じて、既存アルゴリズムよりも高い探索カバレッジ(96.93%)を達成することを示しています。
この論文は、非微分可能なコンポーネント間の相互作用やシステム全体の選好をコンポーネントレベルに変換できないという課題に対処するため、Compound AI システムを有向非巡回グラフとしてモデル化し、システム全体の選好に直接対応する新しいアライメント手法「SysDPO」を提案するものです。
本論文は、データレイクから洞察を得るための複雑なデータ処理パイプラインの設計と実行を評価する新しいベンチマーク「KramaBench」を提案し、現在の AI システムが個々のタスクや草案の生成では一定の成果を収めるものの、実用的なエンドツーエンドのパイプラインを構築する能力には依然として大きな課題があることを明らかにしています。
本研究は、化学文献の多様な図表やテキストから構造データへの変換を可能にするマルチエージェントシステムを開発し、従来の最先端モデルを大幅に上回る精度で化学反応情報の自動抽出を実現したことを報告しています。
気候変動に伴う水災害への対応として、スズメの群れ(ムルミレーション)の知能と大規模言語モデル(LLM)のガイダンスを組み合わせた分散型強化学習フレームワーク「MARLIN」を提案し、不確実性の高い貯水池ネットワーク管理において、従来の手法を凌ぐ計算効率と協調性能を実現したことを示しています。
この論文は、分散型マルチエージェントナビゲーションにおける対称性によるデッドロックを解消するため、トポロジカル不変量である巻き数(winding number)を強化学習で戦略化し、計画器とモデルベース制御器を階層的に統合した「WNumMPC」を提案し、シミュレーションおよび実機実験で高密度かつ対称性の高い環境におけるデッドロック回避と衝突防止の有効性を示したものである。