Multi-Agent Reinforcement Learning for Greenhouse Gas Offset Credit Markets
この論文は、ナッシュ均衡の計算が NP 困難である温室効果ガス排出権市場において、Nash-DQN と呼ばれる強化学習手法を用いて均衡を効率的に推定し、企業がこれに従うことで大幅な財務的節約が可能であることを示しています。
92 件の論文
この論文は、ナッシュ均衡の計算が NP 困難である温室効果ガス排出権市場において、Nash-DQN と呼ばれる強化学習手法を用いて均衡を効率的に推定し、企業がこれに従うことで大幅な財務的節約が可能であることを示しています。
本論文は、消費 CAPM に基づくモデルを用いて、主観的割引因子を 0.97〜0.99 と仮定することで相対的リスク回避係数を約 4.40 と推定し、1977 年の投資家行動分析も含めて株式プレミアム・パズルを解決する妥当なモデルを提示している。
EU における不審取引報告とマネーロンダリングの有罪判決数の関係を分析したこの論文は、報告数の増加が有罪判決の増加に直結するとは限らず、見かけ上の相関に過ぎない可能性を示唆し、報告数の単純な増加が処罰数の増大を確実に導くとは期待できないことを結論付けています。
この論文は、非負の確率変数の和におけるバリュー・アット・リスク(VaR)の加算性について、完全な従属の場合を除き部分加算性は成立せず、負の依存構造と特定の条件の下で完全な超加算性が成り立つことを示す統一的な枠組みを提示しています。
この論文は、交通フロー・排出量と行動反応を統合した多層シミュレーションモデルを提案し、都市交通規制政策の直接的・間接的影響を事前に評価するための新たな枠組みを、広域交通制限の事例研究を通じて実証するものである。
本論文は、金融時系列のノイズや非定常性、クロスセクション依存性に対処し、直接リスク調整済みリターンを最適化するエンドツーエンドの学習型ウェーブレット・トランスフォーマー「WaveLSFormer」を提案し、複数の業界にわたる大規模実験で既存のモデルを大幅に上回る収益性とリスク調整後リターンを達成したことを報告しています。
この論文は、ネットワーク上のノードとして定義されたエージェントが「友人」関係(エッジ)を通じてのみリスクを共有できるという制約下で、最適な線形リスク共有ルールを特徴付け、特に均等なリスク分担の場合にグラフのラプラシアンとの関連性を明らかにするものである。
この論文は、暗号資産市場において均衡制約が実証的に破棄されることを示し、その結果がリスクの誤評価ではなく資本再配分を阻害する摩擦による市場非効率性を意味すると結論付けています。
この論文は、DAO における提案数の増加が広範な参加者の監視能力を超えた時点で、実質的なガバナンス権限が少数の積極的な参加者に集中する傾向があることを、実証データを用いて示しています。
この論文は、貿易と国境を内生的に決定する線形一般均衡モデルを構築し、両者の相互作用が政治経済、安全保障、イデオロギーに及ぼす影響を、従来の外生的アプローチでは説明できない形で統一的に分析する枠組みを提示しています。
この論文は、GPT-4o や FinBERT などの大規模言語モデルを用いてニュースから抽出した「関連性、極性、強度、不確実性、先行性」という多様なセンチメント指標が、従来の極性ベースの手法を超えて WTI 原油先物リターン予測の精度向上に寄与し、特に強度や不確実性に関する特徴量が重要な予測因子であることを示しています。
この論文は、医療画像のレアイベント検出における人間のラベリングで生じる認知バイアスを、フィードバックの偏在を調整し確率的ラベリングを採用することで軽減し、さらに線形対数オッズ再較正を用いて下流の CNN モデルの性能と較正を大幅に改善することを、実証実験を通じて示しています。
この論文は、実務への適用が未だ確立されていない個人請求予備金見積もりについて、既存手法の複雑さや柔軟性の欠如を克服し、古典的なチェーンラダー法を基盤とした新たな視点から実用的な標準手法の確立を目指すものである。
本論文は、金融予測における先見バイアスを防止するため、2013 年から 2024 年までの厳密な年次カットオフで時系列に分割されたデータを用いて事前学習および指示微調整を行い、知識の時間的境界を明確に制御した「DatedGPT」と呼ばれる 12 種類の言語モデルファミリーを提案するものである。
本論文は、IFRS 9 における貸倒リスクの期間構造を推定するために生存分析モデル(離散時間ハザードモデルと条件付き推論生存木)を適用し、2 段階ロジスティック回帰モデルとのベンチマーク比較を通じて、貸倒損失(LGD)モデリングの最適手法を検討した研究です。
この論文は、情報理論に基づくエントロピー解析を用いて、トランプ次期大統領の就任初期における集中した政策発表が、分散とエントロピーの脱結合や累積エントロピーの増加を通じて、地域的に調整されつつも世界的に連動した市場反応として現れたことを示し、従来の手法を補完する新たな市場分析枠組みを提案しています。
この論文は、OECD の国別投入産出表を用いたモデル分析により、サウジアラビアやアラブ首長国連邦、中国などがインドへの輸入制限を行った場合の経済的影響を評価し、サウジアラビアがインド経済にとって最大の制裁リスク要因であることを明らかにしています。
リソースが不足している状況では、AI エージェントの知能向上や多様性がシステム全体の過負荷を悪化させる可能性がある一方、リソースが豊富であればその影響は軽減され、集団の帰結はエージェントの高度さではなく「容量と人口の比率」という単一の数値によって決定されることを、この論文は示しています。
この論文は、戦略的環境における無限の信念の階層を、確率的ショックに基づく条件付けにより決定論的な固定点問題へと帰着させ、有限プレイヤーの連続時間 LQG ゲームにおける均衡を初めて厳密に特徴付け、情報の操作が均衡に与える影響を明示的な「情報楔」を用いて定式化したものである。
本研究は、学際的助成金が直接高インパクトな成果を生むとは限らない一方、専門分野に特化した助成金が学際的研究の進展と高い学術的インパクトを牽引する重要な役割を果たしていることを実証している。