Coordination Games on Multiplex Networks: Consensus, Convergence, and Stability of Opinion Dynamics

本論文は、マルチレイヤーネットワークにおける協調ゲームに基づく意見動力学を解析し、層間の結合メカニズムが単一層では達成できない合意の誘発や加速、あるいは逆に合意の喪失をもたらす可能性を示すとともに、収束性と安定性に関する理論的条件を導出した。

Ruey-An Shiu, Parinaz NaghizadehTue, 10 Ma💻 cs

Deep Incentive Design with Differentiable Equilibrium Blocks

本論文は、ゲームに依存しない微分可能な均衡ブロック(DEB)をモジュールとして用いる「深層インセンティブ設計(DID)」フレームワークを提案し、契約設計や機械スケジューリングなど多様なインセンティブ設計課題に対して、単一のニューラルネットワークで広範なゲーム規模にわたる均衡を効率的に学習・解決できることを示しています。

Vinzenz Thoma, Georgios Piliouras, Luke MarrisTue, 10 Ma🤖 cs.LG

Rigidity in LLM Bandits with Implications for Human-AI Dyads

本論文は、LLM を二腕バンディット問題に適用した実験を通じて、モデルが報酬構造に関わらず位置順序や硬直な探索戦略に偏る決定バイアスを示し、学習率の低さと逆温度の高さという計算モデルで説明できることを明らかにし、これが人間-AI 協調における潜在的な課題を浮き彫りにしたことを述べています。

Haomiaomiao Wang, Tomás E Ward, Lili ZhangTue, 10 Ma💻 cs

A Lightweight MPC Bidding Framework for Brand Auction Ads

本論文は、ブランド広告の安定したユーザー行動と迅速なフィードバックという特性を活用し、複雑な機械学習モデルに依存せずオンライン等方回帰を用いて入札から支出・成約までの単調な関係を構築する軽量なモデル予測制御(MPC)フレームワークを提案し、実装の容易さとコスト効率の向上を実現するものである。

Yuanlong Chen, Bowen Zhu, Bing Xia, Yichuan WangTue, 10 Ma🤖 cs.LG

Leaderboard Incentives: Model Rankings under Strategic Post-Training

本論文は、現在のベンチマークがモデル開発者にテストタスクへの過剰な最適化(benchmaxxing)を促し均衡が存在しないインセンティブ構造を生み出していることを示しつつ、最近提案された「tune-before-test」という評価プロトコルを用いることで、モデルの真の潜在品質に基づく唯一のナッシュ均衡を達成できることを理論的に証明しています。

Yatong Chen, Guanhua Zhang, Moritz HardtTue, 10 Ma🤖 cs.LG

What Do Agents Think One Another Want? Level-2 Inverse Games for Inferring Agents' Estimates of Others' Objectives

この論文は、分散型環境におけるエージェント間の戦略的相互作用をより正確に理解するために、第三者が他者の目的を完全に知っているという従来の仮定を越え、各エージェントが他者の目的をどのように推定しているかを推論する「レベル 2 逆ゲーム」の枠組みを提案し、その非凸性を証明するとともに効率的な解法を開発したものである。

Hamzah I. Khan, Jingqi Li, David Fridovich-KeilThu, 12 Ma💻 cs

Simplifying Preference Elicitation in Local Energy Markets: Combinatorial Clock Exchange

この論文は、分散型エネルギーリソースの普及に伴う複雑な選好を扱うため、機械学習を活用した反復的な組み合わせクロック交換メカニズムを導入し、プロシューマーが直感的な形式で入札できるローカルエネルギー市場を提案し、約 15 回のクロック反復で収束することを実証しています。

Shobhit Singhal, Lesia MitridatiThu, 12 Ma⚡ eess

Sequential Causal Normal Form Games: Theory, Computation, and Strategic Signaling

この論文は、リーダー・フォロワー相互作用に因果階層を組み込んだ逐次因果ゲームの理論的枠組みを提案するものの、シミュレーションを通じて合理的な後方帰納法では古典的なスタッケルベルグ均衡に対して福利の改善が全く見られず、因果的推論の利点が標準的な均衡概念では実現できないという重要な限界を明らかにしています。

Dennis ThummThu, 12 Ma📊 stat

Deciding winning strategies in Yu-Gi-Oh! TCG is hard

この論文は、マジック:ザ・ギャザリングの先行研究に触発され、遊戯王 TCG における特定の計算可能な戦略が勝利するか否かを判定する問題が決定不能であり、実際にはΠ11\Pi^1_1-完全であることを、現在の禁止・制限リストに準拠した具体的なデッキ構成を用いて証明したものである。

Orazio Nicolosi, Federico Pisciotta, Lorenzo BresolinThu, 12 Ma🔢 math

Code-Space Response Oracles: Generating Interpretable Multi-Agent Policies with Large Language Models

この論文は、解釈性の低い深層強化学習に代わり大規模言語モデルを用いて可読なコードとして方策を生成する「コード空間反応オラクル(CSRO)」という新たなマルチエージェント学習フレームワークを提案し、競合する性能を維持しつつ説明可能な多様な戦略の発見を実現することを示しています。

Daniel Hennes, Zun Li, John Schultz, Marc LanctotThu, 12 Ma🤖 cs.AI

Instant Runoff Voting on Graphs: Exclusion Zones and Distortion

本論文は、グラフ上のメトリック選好に基づく即時決選投票(IRV)における「排除領域」の特定問題が一般グラフでは計算困難である一方、木構造上では多項式時間で解けることを示し、さらに強制的な候補排除という性質を満たす任意の決定論的順位ベースの投票ルールにおいても同様の困難性が維持されること、およびこの設定におけるIRV の功利主義的歪みに関する上下界を明らかにしたものである。

Georgios Birmpas, Georgios Chionas, Efthyvoulos Drousiotis, Soodeh Habibi, Marios Mavronicolas, Paul SpirakisThu, 12 Ma💻 cs

On the Existence of Fair Allocations for Goods and Chores under Dissimilar Preferences

この論文は、Gorantla らが提起した未解決問題に対し、任意のグループ数とアイテム種類数に対して公平な割り当てが存在するための明示的な上限値を導出する単純かつ強力な手法を提案し、物品・ chore・連続領域など多様な公平分与設定に拡張可能な成果を達成したことを示しています。

Egor Gagushin, Marios Mertzanidis, Alexandros PsomasMon, 09 Ma💻 cs

The Coordination Gap: Alternation Metrics for Temporal Dynamics in Multi-Agent Battle of the Exes

この論文は、従来の指標が時間的構造を捉えきれないという課題を指摘し、マルチエージェント協調の質を評価するために「完全交互性(Perfect Alternation)」を基準とした新たな「交互性(Alternation)指標」を導入し、Q 学習エージェントが伝統的な指標では高く評価されるにもかかわらず、ランダム方策よりも協調性能が大幅に劣るという矛盾を明らかにした。

Nikolaos Al. Papadopoulos, Konstantinos PsannisMon, 09 Ma🤖 cs.LG