Offer of a reward does not always promote trust in spatial games
この論文は、空間的信頼ゲームにおける報酬メカニズムの研究を通じて、中程度の報酬は信頼を促進するが、過剰な報酬や安価な報酬は逆に信頼の進化を阻害するという、信頼と報酬の関係における直感に反する複雑な実態を明らかにしています。
62 件の論文
この論文は、空間的信頼ゲームにおける報酬メカニズムの研究を通じて、中程度の報酬は信頼を促進するが、過剰な報酬や安価な報酬は逆に信頼の進化を阻害するという、信頼と報酬の関係における直感に反する複雑な実態を明らかにしています。
この論文は、平均報酬ゲームを解くための新しい決定論的かつ対称的な再帰アルゴリズムを提案している。
本論文は、マルチレイヤーネットワークにおける協調ゲームに基づく意見動力学を解析し、層間の結合メカニズムが単一層では達成できない合意の誘発や加速、あるいは逆に合意の喪失をもたらす可能性を示すとともに、収束性と安定性に関する理論的条件を導出した。
本論文は、ゲームに依存しない微分可能な均衡ブロック(DEB)をモジュールとして用いる「深層インセンティブ設計(DID)」フレームワークを提案し、契約設計や機械スケジューリングなど多様なインセンティブ設計課題に対して、単一のニューラルネットワークで広範なゲーム規模にわたる均衡を効率的に学習・解決できることを示しています。
本論文は、LLM を二腕バンディット問題に適用した実験を通じて、モデルが報酬構造に関わらず位置順序や硬直な探索戦略に偏る決定バイアスを示し、学習率の低さと逆温度の高さという計算モデルで説明できることを明らかにし、これが人間-AI 協調における潜在的な課題を浮き彫りにしたことを述べています。
本論文は、ブランド広告の安定したユーザー行動と迅速なフィードバックという特性を活用し、複雑な機械学習モデルに依存せずオンライン等方回帰を用いて入札から支出・成約までの単調な関係を構築する軽量なモデル予測制御(MPC)フレームワークを提案し、実装の容易さとコスト効率の向上を実現するものである。
本論文は、現在のベンチマークがモデル開発者にテストタスクへの過剰な最適化(benchmaxxing)を促し均衡が存在しないインセンティブ構造を生み出していることを示しつつ、最近提案された「tune-before-test」という評価プロトコルを用いることで、モデルの真の潜在品質に基づく唯一のナッシュ均衡を達成できることを理論的に証明しています。
この論文は、偏った相互作用ゲームを用いて、権力や希少性といったバイアスが階層や不平等、協力の出現に与える影響を分析し、社会システム(極端な資本主義や平等主義を含む)の非線形な動態や富の再分配哲学の比較モデル化におけるその有効性を示しています。
本論文は、AI 支援進化探索フレームワーク「AlphaEvolve」を用いて双方向取引におけるランダム・オファラー機構の最悪ケースを探索し、従来の予想(2 倍)や既存の反例(約 2.02 倍)を更新する 2.0749 倍という新たな下界を確立したものである。
この論文は、分散型環境におけるエージェント間の戦略的相互作用をより正確に理解するために、第三者が他者の目的を完全に知っているという従来の仮定を越え、各エージェントが他者の目的をどのように推定しているかを推論する「レベル 2 逆ゲーム」の枠組みを提案し、その非凸性を証明するとともに効率的な解法を開発したものである。
この論文は、分散型エネルギーリソースの普及に伴う複雑な選好を扱うため、機械学習を活用した反復的な組み合わせクロック交換メカニズムを導入し、プロシューマーが直感的な形式で入札できるローカルエネルギー市場を提案し、約 15 回のクロック反復で収束することを実証しています。
この論文は、リーダー・フォロワー相互作用に因果階層を組み込んだ逐次因果ゲームの理論的枠組みを提案するものの、シミュレーションを通じて合理的な後方帰納法では古典的なスタッケルベルグ均衡に対して福利の改善が全く見られず、因果的推論の利点が標準的な均衡概念では実現できないという重要な限界を明らかにしています。
この論文は、マジック:ザ・ギャザリングの先行研究に触発され、遊戯王 TCG における特定の計算可能な戦略が勝利するか否かを判定する問題が決定不能であり、実際には-完全であることを、現在の禁止・制限リストに準拠した具体的なデッキ構成を用いて証明したものである。
この論文は、理論的根拠に基づいたゲーム理論的評価枠組み(QRE)を導入し、大規模言語モデルの戦略的推論能力を人間のデータと比較して連続的な尺度で定量化・検証する手法を提案し、その有効性と課題を示しています。
この論文は、解釈性の低い深層強化学習に代わり大規模言語モデルを用いて可読なコードとして方策を生成する「コード空間反応オラクル(CSRO)」という新たなマルチエージェント学習フレームワークを提案し、競合する性能を維持しつつ説明可能な多様な戦略の発見を実現することを示しています。
本論文は、グラフ上のメトリック選好に基づく即時決選投票(IRV)における「排除領域」の特定問題が一般グラフでは計算困難である一方、木構造上では多項式時間で解けることを示し、さらに強制的な候補排除という性質を満たす任意の決定論的順位ベースの投票ルールにおいても同様の困難性が維持されること、およびこの設定におけるIRV の功利主義的歪みに関する上下界を明らかにしたものである。
この論文は、大規模言語モデル(LLM)に基づく価格設定エージェントが寡占市場において自律的に競争を超えた価格と利益に到達し、指示文の些細な変化や価格戦争への懸念がその程度に影響を与えることを示し、AI 価格設定エージェントの規制に新たな課題を提起している。
この論文は、Gorantla らが提起した未解決問題に対し、任意のグループ数とアイテム種類数に対して公平な割り当てが存在するための明示的な上限値を導出する単純かつ強力な手法を提案し、物品・ chore・連続領域など多様な公平分与設定に拡張可能な成果を達成したことを示しています。
不完全監視下における無限に繰り返されるゲームにおいて、統計的仮説検定を用いて協力的な混合行動プロファイルからの逸脱を検出し懲罰に移行する「テスト・テン・パニッシュ」戦略を提案し、その実装方法を通じて Folk 定理を再構築する。
この論文は、従来の指標が時間的構造を捉えきれないという課題を指摘し、マルチエージェント協調の質を評価するために「完全交互性(Perfect Alternation)」を基準とした新たな「交互性(Alternation)指標」を導入し、Q 学習エージェントが伝統的な指標では高く評価されるにもかかわらず、ランダム方策よりも協調性能が大幅に劣るという矛盾を明らかにした。