Learn to Bid as a Price-Maker Wind Power Producer
本論文は、価格形成者として市場価格に影響を与える風力発電事業者向けに、他の参加者の行動を推定する複雑な二階層最適化モデルに依存せず、文脈付き多腕バンディット問題として定式化されたオンライン学習アルゴリズムを提案し、ドイツの電力市場シミュレーションを通じてその有効性を検証したものである。
4175 件の論文
本論文は、価格形成者として市場価格に影響を与える風力発電事業者向けに、他の参加者の行動を推定する複雑な二階層最適化モデルに依存せず、文脈付き多腕バンディット問題として定式化されたオンライン学習アルゴリズムを提案し、ドイツの電力市場シミュレーションを通じてその有効性を検証したものである。
この論文は、非ユークリッド空間における従来の最大マージン分類の限界を指摘し、クラス共分散構造をチョレスキー分解を用いて最適化問題に組み込むことで、精度や F1 スコアなどの性能を向上させる共分散調整型サポートベクター分類アルゴリズムを提案しています。
本論文は、手動設計された事前知識の信頼性を推定する「不完全事前知識」の概念と、粒状計算に基づく「GBPC アルゴリズム」を導入し、わずか 10 組の画像対のみで学習可能な軽量な汎用深層画像融合手法を提案するものです。
この論文は、需要の欠測(センサリング)と依存性を伴うオフラインデータを用いて、在庫管理と価格設定の最適方針を学習する新たなデータ駆動型アルゴリズムを提案し、その有効性を理論的および数値的に検証するものである。
本論文は、非線形制御アフィン系(特にドリフトフリーおよび線形時不変システム)の確率密度を制御するために、白色ノイズによる前向き拡散過程と、これを目標分布へ誘導する決定論的逆拡散過程に基づく新しいフィードバック制御・計画フレームワークを提案し、その理論的保証と数値的有効性を示しています。
この論文は、タスク間干渉を抑制し、固定されたスイッチング間隔に依存しない適応的なタスクスイッチング方策を採用することで、リソース制約のある自律エージェントの効率的かつスケーラブルな多タスク学習を実現する新しい手法「SwitchMT」を提案し、その有効性をアタリゲームでの実験結果を通じて実証しています。
進化アルゴリズムで発見された大規模なカオス力学系の合成データで事前学習された「Panda」は、低次元の常微分方程式のみを学習したにもかかわらず、ゼロショットで未知のカオス系や実世界の時間系列、さらには偏微分方程式の予測にも成功し、非線形力学における事前学習モデルの可能性を示しました。
この論文は、2022 年から 2025 年にかけての ACL および arXiv 論文 25 万件を分析し、大規模言語モデル(LLM)の限界に関する研究(LLLMs)が急速に拡大し、推論、一般化、幻覚、バイアス、セキュリティが主要な研究トピックであることをデータ駆動型で包括的に調査したものです。
この論文は、新規環境における複数の事前学習済み知覚モデルの予測矛盾を、整合性に基づく帰納推論(アブダクション)として定式化し、論理的整合性を保ちつつ予測カバレッジを最大化する新しい枠組みを提案することで、単一モデルや標準的なアンサンブル手法を上回る頑健な性能を実現することを示しています。
本論文は、連続的なターゲット値の閾値設定を不要とし、解釈性と高速な実行を両立させるために、重回帰問題における不均衡データ処理のために CART(分類回帰木)に基づいた合成サンプリング手法「CARTGen-IR」を提案するものです。
小売販売予測に関する本研究は、欠損値や不規則な需要といった実務的な制約下では、複雑な深層学習モデルよりもXGBoost などの局所的な木ベースのアンサンブル手法が RMSE 4.833 で最高性能を示し、問題特性に合わせたモデル選択が重要であることを示しています。
この論文は、強化学習(RL)が既存の能力の維持に優れる一方、教師あり微調整(SFT)が新たな知識の習得に有効であるという相補性を活かし、難問への対応時に高品質な解答でオンライン微調整を交互に行う「ReLIFT」という新たな学習手法を提案し、RL や SFT 単独よりも少ないデータで競争レベルのベンチマークにおいて顕著な性能向上を実現したことを示しています。
この論文は、並列トレーニングと逐次推論の両立を可能にする「Prefix-Scannable Models(PSM)」という新しいモデルクラスを提案し、従来の状態空間モデルや線形トランスフォーマーを一般化して、O(1) の計算量と対数メモリで動作しつつトランスフォーマーの表現力を維持する手法を理論的・実験的に検証しています。
この論文は、記号 AI から大規模言語モデル(LLM)に至るまで、機械学習における差分プライバシーの定義、理論的・応用的な進化、学習モデルへの統合手法、および実用的な評価方法について包括的に調査・概説したものです。
本論文は、輪郭係数の代理指標に基づいて各データ点に重みを付与し、境界点やノイズの影響を低減することで k-means の性能を向上させる「K-Sil」という新しいクラスタリング手法を提案し、その収束性を理論的に保証するとともに、多様な実データセットにおける有効性を実証しています。
ゼロショット協調(ZSC)における既存のベンチマークである Hanabi 学習環境の限界を克服し、移動するカードの信念追跡や曖昧なヒントの推論など、より高度な協調能力を評価するための新たなオープンソースベンチマーク「Yokai 学習環境(YLE)」を提案し、HLE で最高性能を達成した手法が YLE では性能が低下することを示すことで、単一のベンチマークでの進捗が一般化しないことを実証した。
本論文は、ガウス報酬を持つ確率的バンディット問題におけるシャープレシオ最大化に対して、トンプソンサンプリングに基づくアルゴリズム「SRTS」を提案し、対数 regrets 上界と一致する下界を導出することでその順序最適性を理論的に証明するとともに、数値実験で既存手法を上回る性能を実証したものである。
この論文は、大域的制御場のみを用いたアナログ量子シミュレータが普遍性を持つための必要十分条件を理論的に確立し、直接量子最適制御法を用いて実機(リチウム原子アレイ)で多体相互作用やトポロジカルダイナミクスを実証することで、ハードウェア固有のハミルトニアンを超えた汎用的な量子シミュレーションの実現可能性を示した。
本論文は、テンソルの特定のモードに沿ったファイバーが完全に観測されているか欠損しているという「ファイバーごとの観測」パターンに特化した、標準的な線形代数演算に基づく高速かつ確定的なテンソル・トレイン分解による補完手法を提案し、その有効性を示しています。
この論文は、関数エンコーダ方策を用いたニューラル基底関数の事前学習とオンラインでの軽量係数推定により、目的関数が変化するパラメータ最適制御問題に対して、従来の最適化手法に比べて計算コストを大幅に削減しつつ、ほぼ最適な性能でゼロショット適応を可能にする転移可能な解法を提案しています。