Parallelized Planning-Acting for Efficient LLM-based Multi-Agent Systems in Minecraft
この論文は、Minecraft のような動的環境における LLM ベッドのマルチエージェントシステムのリアルタイム応答性を向上させるため、中央集権的なメモリシステムとスキルライブラリを備えた双スレッド構造により、並列的な計画と実行を可能にする新たなフレームワークを提案し、その有効性を検証したものである。
6330 件の論文
この論文は、Minecraft のような動的環境における LLM ベッドのマルチエージェントシステムのリアルタイム応答性を向上させるため、中央集権的なメモリシステムとスキルライブラリを備えた双スレッド構造により、並列的な計画と実行を可能にする新たなフレームワークを提案し、その有効性を検証したものである。
この論文は、解剖学的ランドマークを組み込んだトランスフォーマーベースの幾何学的深層学習モデルを提案し、侵襲的で高価なPETスキャンに頼らずにアルツハイマー病の診断精度を向上させ、中リスク群における脳アミロイド陽性性の予測を可能にするものである。
本論文は、大規模な視覚言語モデルの推論能力をアテンションマップに蒸留し、それを社会的コストマップとして活用することで、実世界での社会的に配慮されたロボットナビゲーションの成功率を大幅に向上させる新しい手法「ViLAM」を提案しています。
本論文は、ユーザーの自撮り写真をガウス領域適応技術を用いて3Dアバターに変換し、さらにユーザーのアイデンティティを保持したまま二次的なスタイルを付与する「デュアル・スタイライゼーション」プロセスを通じて、モバイル端末で30〜40 FPS のアニメーション再生を可能にする即時生成型アバターシステム「Snapmoji」を提案するものです。
この論文は、大規模言語モデルと人間の協働を構造化された双方向の対話プロトコルで制御する「iProg」というツールを提案し、天体物理学や生化学の分野におけるデータ分析システムの開発において、従来のノーコード手法よりも高い品質と効率を実現することを示しています。
本論文は、テキスト条件付き 3D 室内シーン生成の評価における既存手法の限界を克服するため、明示的な要件と暗黙的な期待の両方を測定する新たな評価フレームワーク「SceneEval」と、それを支えるベンチマークデータセット「SceneEval-500」を提案し、現在の生成手法が実用性と制御可能性において依然として課題を抱えていることを明らかにしています。
本論文は、従来のバックワードコンパチブル学習における厳密なアライメント制約が新モデルの識別能力を損なう問題を解決するため、旧モデルの原型に摂動を導入して制約を緩和し、ランドマークおよび商品データセットにおいて最先端の手法を上回る性能を示す「原型摂動」アプローチを提案するものである。
本論文は、中間ノードで鍵を平文化せずに完全準同型暗号を用いて再暗号化を行うゼロトラスト中継アーキテクチャを提案し、既存の QKD 標準との互換性を保ちながら大規模量子鍵配送ネットワークの信頼性と拡張性を飛躍的に向上させることを実証しています。
本論文は、視覚基盤モデルからの多様な 2D 事前知識を統合して構造整合性を確保し、衝突勾配に基づく生成拡散モデルを用いて物理的に妥当な 3D 両手姿勢を生成することで、単眼画像からの両手再構成における複雑な姿勢や重度の遮蔽、手同士の貫通問題を解決する手法を提案しています。
この論文は、大規模言語モデルを活用して皮膚科症例シミュレーション、論文検索、医療ニュース要約などの対話型ツールを提供する「MediTools」という医療教育プラットフォームを開発し、その有効性を医療従事者や学生への調査を通じて検証したことを報告しています。
本論文は、AI 駆動型の 6G 無線システムにおけるプッシュ型とプル型の通信を分類・統合する MAC プロトコルの設計指針とアーキテクチャを提案し、O-RAN への実装に向けたトレードオフや原則を論じています。
この論文は、既知のシーン制約を考慮して任意のスケールと姿勢で物体を補完する新しい点群ベースのインスタンス補完モデルと、その評価用の新しいデータセット「ScanWCF」を提案し、既存の手法よりも高い忠実度と完成品質を実現することを示しています。
本論文は、トランスフォーマーの注意機構やスペクトル抽出などのモジュールにリプシッツ連続性制約を課し、学習可能なアンサンブル融合戦略を組み合わせることで、脳波に基づく感情認識の安定性、精度、およびロバスト性を向上させる新しいフレームワーク「LEL」を提案し、複数のベンチマークデータセットで優れた性能を実証したものである。
本論文は、地理空間認識を備えたマルチモーダルエージェント「GeoNav」を提案し、大規模な都市環境における言語目標航空ナビゲーションにおいて、人間の粗い-to-細かい推論パターンを模倣する二重スケールの空間表現と空間的連鎖思考メカニズムを活用することで、最先端の性能を大幅に上回る成果を達成したことを報告しています。
本論文は、哺乳類の空間認知に着想を得て、直交制約付き変分情報ボトルネック(O-VIB)エンコーダを導入し、冗長な特徴を剪除することで帯域幅制約の厳しい都市環境における高精度な視覚的局所化を実現するタスク指向のセマンティック圧縮フレームワークを提案するものである。
この論文は、ロボットのベース姿勢最適化において、ベイズ最適化、網羅的探索、遺伝的アルゴリズム、確率的勾配降下法を比較し、確率的勾配降下法が実世界タスクの成功率で優れ、遺伝的アルゴリズムが最終コストの面で優れていることを示しています。
本論文は、黒箱環境における多目標バックドア攻撃の課題であるトリガーの特定性と隠蔽性の欠如を解決するため、局所空間領域へのトリガー制限と周波数領域に基づく注入手法を組み合わせ、高い攻撃成功率と目立たなさを両立する「SFIBA」と呼ばれる新しい攻撃手法を提案し、その有効性を検証したものである。
本論文は、モジュールロボットの構成、ベース位置、軌道を同時に最適化することで、タスクのサイクルタイムを最大 25% 短縮し、従来手法よりも多くのベンチマークで実行可能な解を見出すことを可能にする画期的な手法を提案し、実世界での実証実験でも高い有効性を示しています。
この論文は、混在交通環境において専用バスレーンでの接続・自動化車両(CAV)の協調経路制御を導入し、リアルタイム交通データに基づいて CAV の経路を動的に調整することで、バスの定時性維持と CAV の移動効率の両立を図る手法を提案し、SUMO によるシミュレーションでその有効性を検証したものである。
94 人の初心者のカウンセラーを対象とした無作為化研究により、LLM による模擬練習に構造化されたフィードバックを組み合わせることで、クライアント中心のマイクロスキルや共感力が向上し、フィードバックなしの練習のみでは効果が得られなかったことが示されました。