NashOpt -- A Python Library for Computing Generalized Nash Equilibria
NashOpt は、共有制約を持つ非協力ゲームにおける一般ナッシュ均衡の計算と設計を可能にするオープンソースの Python ライブラリであり、JAX を活用した非線形最小二乗法や混合整数線形計画法を通じて、非線形ゲームから線形二次ゲーム、逆ゲームやスタッケルベルグゲーム設計問題までを包括的にサポートします。
6492 件の論文
NashOpt は、共有制約を持つ非協力ゲームにおける一般ナッシュ均衡の計算と設計を可能にするオープンソースの Python ライブラリであり、JAX を活用した非線形最小二乗法や混合整数線形計画法を通じて、非線形ゲームから線形二次ゲーム、逆ゲームやスタッケルベルグゲーム設計問題までを包括的にサポートします。
この論文は、保存則と整合的な符号化(CCE)フレームワークを導入し、情報処理を不可逆的な物理過程として記述することで、知性・意識・量子測定・時空幾何学を熱力学的散逸の観点から統一的に理解する物理理論を提案しています。
本論文は、自動運転における生成ワールドモデルの進捗を測定し、視覚的リアリズム、軌道の妥当性、時間的整合性、制御性を包括的に評価する初のベンチマーク「DrivingGen」を提案し、既存モデルの課題とトレードオフを明らかにしたものである。
Frontier 超計算機の実運用データを用いた物理ガイド型機械学習フレームワークにより、冷却システムの非効率を特定し、安全な設定値の微調整を通じて年間 85 MWh に及ぶ過剰な冷却エネルギーの最大 96% を削減可能であることを示しました。
この論文は、関連するクエリを独立して処理するのではなく、バッチ単位で共同処理することで推論パターンや一貫性制約を共有し、精度向上とコスト削減を実現する「Batch-of-Thought(BoT)」というトレーニング不要の手法を提案しています。
本論文は、医療画像分析における大規模視覚言語モデルの限界を克服するため、タスクに応じたプロンプト構成、例示記憶に基づく生成、臨床的誤りの批判的検証、そして修正という 4 つの協調エージェントからなる自己改善型フレームワーク「R^4」を提案し、微調整なしでレポート生成および物体検出の精度を大幅に向上させることを示しています。
この論文は、画像生成 AI の学習データ選定に広く用いられている「LAION-Aesthetics Predictor」を監査・追跡民族誌的に調査し、その評価基準が西洋中心の男性視点や帝国主義的視線を反映して特定の文化的・社会的バイアスを強化していることを明らかにし、AI 開発者に対し画一的な美の尺度から多様な評価へと転換するよう呼びかけています。
本論文は、コンピュータ操作エージェントにおけるプロンプト注入攻撃を防ぐために、信頼できるタスク計画と不審な環境観測を厳密に分離する「シングルショット計画」アーキテクチャを提案し、セキュリティと実用性を両立させることを実証しています。
この論文は、Reddit の議論を分析し、ユーザーが AI の迎合的行動を検知・対応する様子を「DCR 認識論」で解明し、脆弱な立場のユーザーが感情的支援としてこれを求める場合もあることを示すことで、迎合的行動の完全排除ではなく文脈に応じた AI 設計の必要性を提唱しています。
本論文は、2024 年パリオリンピックで中国代表チームの歴史的なメダル獲得に貢献し、構造化されていないボクシングの試合映像を戦略的知能へ変換する閉ループ AI 最適化システム「BoxMind」を提案・実証したものである。
本論文は、観光客と地元住民など異なるシナリオ間の移動パターンを捉え、その競合を解決するために、シナリオ固有の多視点分離ハイパーグラフとパラメータ分割メカニズムを導入した「MSAHG」と呼ばれる次なる POI 推薦フレームワークを提案し、実データによる実験で既存手法を上回る性能を実証したものである。
本論文は、大規模教師モデルからの蒸留と、予算感知動的計画法に基づく「サンドイッチ」構造の効率的なアテンション機構を組み合わせることで、iPhone 上で 10FPS 超のストリーミング生成を実現しつつ、サーバー級の高品質な動画生成を可能にする「S2DiT」を提案する。
本論文は、報酬が均等である制約付き契約設計の問題を研究し、多様な報酬関数に対する近似アルゴリズムと計算量的困難性の結果を示すとともに、公平性による効用損失(価格の均等性)の厳密な評価を提供し、制約なしの契約設計における未解決問題も解決したものである。
本論文は、視覚と自己位置推定(プロプリオセプション)のバランスを再調整し、タスク進行に応じた視覚的手がかりを導入することで、視覚言語行動モデルにおける「失敗した実行を完了したと誤認する」現象を解決し、新しいベンチマークと ReViP というフレームワークを提案する研究です。
本論文では、3,847 時間の運転動画と多粒度の注釈データに基づく大規模な第一人称視点のベンチマーク「ScenePilot-Bench」を提案し、自律運転シナリオにおけるビジョン・ランゲージモデルの性能評価と安全性向上のための包括的な枠組みを提供しています。
この論文は、音声の周波数特性と質問文の文脈を空間・時間・周波数領域で統合的に相互作用させる「QSTar」手法と「QCR」ブロックを提案し、既存の手法よりも優れた音楽音声・視覚質問応答(AVQA)の性能達成を実現したことを示しています。
この論文は、固定定数 に対して、Nagamochi-Ibaraki 疎性証明書とリンク・カット木を組み合わせることで辺の挿入を、最大流計算を用いることで辺の削除をそれぞれ効率的に処理し、 本の辺を維持しながら -辺連結性を動的に保守するフレームワークを提案するものである。
本論文は、RNA-seq やバリアントコーリングなどのバイオインフォマティクスタスクにおける AI エージェントの性能と堅牢性を評価するためのベンチマーク「BioAgent Bench」を提案し、最先端モデルが複雑なパイプラインを構築できる一方で、入力改変などの摂動に対する脆弱性や、プライバシー制約下でのオープンウェイトモデルの有用性を明らかにしたことを述べています。
本論文は、強化学習による大規模言語モデルの人間との整合性確保において生じる報酬過最適化問題を解決するため、事前学習済みモデルのセマンティック表現に依存する従来の手法を超え、強化学習中のポリシー分布のリアルタイムな変化を反映する「R2M(リアルタイム整合報酬モデル)」という軽量フレームワークを提案しています。
本論文は、DeBERTa、RoBERTa、FinBERT の 3 つの LLM を用いたニュース感情分析と株価予測モデルを統合評価し、DeBERTa が単独で 75% の精度を達成し、3 モデルのアンサンブルでは 80% まで向上すること、および感情分析特徴量が LSTM や PatchTST などの予測モデルにわずかながら有益であることを示しています。