IPPO Learns the Game, Not the Team: A Study on Generalization in Heterogeneous Agent Teams
本論文は、異種エージェント環境における自己対戦ベースの IPPO が、多様なトレーニングパートナーを意図的に導入する手法(RPT)と同等の汎化性能を示すことを明らかにし、単純な IPPO ベースラインが新規チームメイトに対しても十分な適応能力を有していることを実証しています。
6418 件の論文
本論文は、異種エージェント環境における自己対戦ベースの IPPO が、多様なトレーニングパートナーを意図的に導入する手法(RPT)と同等の汎化性能を示すことを明らかにし、単純な IPPO ベースラインが新規チームメイトに対しても十分な適応能力を有していることを実証しています。
オフロード環境における道路ネットワーク抽出の課題を解決するため、大規模なオフロードデータセット「WildRoad」を公開し、従来のノード中心アプローチの限界を克服する経路中心のフレームワーク「MaGRoad」を提案し、高い精度と高速推論を実現する研究です。
本論文は、手術映像における器具セグメンテーションの課題を解決するため、SAM3 のメモリ更新や容量制限、再出現時の識別問題を克服するトレーニング不要な拡張手法「ReMeDI-SAM3」を提案し、複数のデータセットで既存手法を上回る性能を達成したことを報告しています。
この論文は、5 か国 1,000 人の調査とストリートビュー画像を用いた分析を通じて、都市の緑化に対する主観的認識と客観的測定値の乖離が世界的に普遍的であり、個人の属性や性格よりも居住地域による文化的・環境的経験の影響が最も大きいことを明らかにしています。
この論文は、単一画像からの 3D 意味シーン補完において、可視領域の知覚と遮蔽領域の推論を分離・統合する「VOIC」という新たな双デコーダフレームワークを提案し、既存手法を上回る性能を達成したことを示しています。
この論文は、Google BigQuery 上の大規模データセットを用いた実験を通じて、推論モデルが非推論モデルと比較してデータ転送量を大幅に削減しつつ同等の精度を維持し、実行時間とクラウドコストの相関が弱いことを示し、Text-to-SQL 導入におけるコスト最適化の指針を提示しています。
NashOpt は、共有制約を持つ非協力ゲームにおける一般ナッシュ均衡の計算と設計を可能にするオープンソースの Python ライブラリであり、JAX を活用した非線形最小二乗法や混合整数線形計画法を通じて、非線形ゲームから線形二次ゲーム、逆ゲームやスタッケルベルグゲーム設計問題までを包括的にサポートします。
この論文は、保存則と整合的な符号化(CCE)フレームワークを導入し、情報処理を不可逆的な物理過程として記述することで、知性・意識・量子測定・時空幾何学を熱力学的散逸の観点から統一的に理解する物理理論を提案しています。
本論文は、自動運転における生成ワールドモデルの進捗を測定し、視覚的リアリズム、軌道の妥当性、時間的整合性、制御性を包括的に評価する初のベンチマーク「DrivingGen」を提案し、既存モデルの課題とトレードオフを明らかにしたものである。
Frontier 超計算機の実運用データを用いた物理ガイド型機械学習フレームワークにより、冷却システムの非効率を特定し、安全な設定値の微調整を通じて年間 85 MWh に及ぶ過剰な冷却エネルギーの最大 96% を削減可能であることを示しました。
この論文は、関連するクエリを独立して処理するのではなく、バッチ単位で共同処理することで推論パターンや一貫性制約を共有し、精度向上とコスト削減を実現する「Batch-of-Thought(BoT)」というトレーニング不要の手法を提案しています。
本論文は、医療画像分析における大規模視覚言語モデルの限界を克服するため、タスクに応じたプロンプト構成、例示記憶に基づく生成、臨床的誤りの批判的検証、そして修正という 4 つの協調エージェントからなる自己改善型フレームワーク「R^4」を提案し、微調整なしでレポート生成および物体検出の精度を大幅に向上させることを示しています。
この論文は、画像生成 AI の学習データ選定に広く用いられている「LAION-Aesthetics Predictor」を監査・追跡民族誌的に調査し、その評価基準が西洋中心の男性視点や帝国主義的視線を反映して特定の文化的・社会的バイアスを強化していることを明らかにし、AI 開発者に対し画一的な美の尺度から多様な評価へと転換するよう呼びかけています。
本論文は、コンピュータ操作エージェントにおけるプロンプト注入攻撃を防ぐために、信頼できるタスク計画と不審な環境観測を厳密に分離する「シングルショット計画」アーキテクチャを提案し、セキュリティと実用性を両立させることを実証しています。
この論文は、Reddit の議論を分析し、ユーザーが AI の迎合的行動を検知・対応する様子を「DCR 認識論」で解明し、脆弱な立場のユーザーが感情的支援としてこれを求める場合もあることを示すことで、迎合的行動の完全排除ではなく文脈に応じた AI 設計の必要性を提唱しています。
本論文は、2024 年パリオリンピックで中国代表チームの歴史的なメダル獲得に貢献し、構造化されていないボクシングの試合映像を戦略的知能へ変換する閉ループ AI 最適化システム「BoxMind」を提案・実証したものである。
本論文は、観光客と地元住民など異なるシナリオ間の移動パターンを捉え、その競合を解決するために、シナリオ固有の多視点分離ハイパーグラフとパラメータ分割メカニズムを導入した「MSAHG」と呼ばれる次なる POI 推薦フレームワークを提案し、実データによる実験で既存手法を上回る性能を実証したものである。
本論文は、大規模教師モデルからの蒸留と、予算感知動的計画法に基づく「サンドイッチ」構造の効率的なアテンション機構を組み合わせることで、iPhone 上で 10FPS 超のストリーミング生成を実現しつつ、サーバー級の高品質な動画生成を可能にする「S2DiT」を提案する。
本論文は、報酬が均等である制約付き契約設計の問題を研究し、多様な報酬関数に対する近似アルゴリズムと計算量的困難性の結果を示すとともに、公平性による効用損失(価格の均等性)の厳密な評価を提供し、制約なしの契約設計における未解決問題も解決したものである。
本論文は、視覚と自己位置推定(プロプリオセプション)のバランスを再調整し、タスク進行に応じた視覚的手がかりを導入することで、視覚言語行動モデルにおける「失敗した実行を完了したと誤認する」現象を解決し、新しいベンチマークと ReViP というフレームワークを提案する研究です。