Testing Most Influential Sets
この論文は、線形最小二乗法において最大影響力を持つデータ部分集合の分布を厳密に導出・分析することで、その影響力が自然な変動を超えているかを統計的に検定する新たな枠組みを提案し、経済学や生物学などの分野における争点となっている知見の解決に貢献しています。
251 件の論文
この論文は、線形最小二乗法において最大影響力を持つデータ部分集合の分布を厳密に導出・分析することで、その影響力が自然な変動を超えているかを統計的に検定する新たな枠組みを提案し、経済学や生物学などの分野における争点となっている知見の解決に貢献しています。
この論文は、e 値と e プロセスを用いたノンパラメトリック逐次フレームワークを提案し、依存性やモデル誤指定に頑健な任意の時点で有効な推論を可能にすることで、一般的なリスク測度(VaR や ES など)の相対的バックテストを強化する手法を開発したものである。
この論文は、ベイズ非パラメトリック手法を用いて有限混合モデルの各成分を非パラメトリックに学習する枠組みを提案し、成分分布の識別可能性と事後収束性を理論的に証明するとともに、効率的な MCMC アルゴリズムを開発してシミュレーションおよび実データでその有効性を示しています。
この論文は、従来のデータ駆動型のシャプレイ値が共変量バイアスなどの因果的誤解を招く可能性を指摘し、データの因果構造を活用して特徴量の重要性をより正確に評価する「cc-Shapley」という新しい手法を提案し、その理論的妥当性と実証的有効性を示しています。
この論文は、外部対照データを活用した近接因果推論手法を適用することで、カボテグラビルの能動的対照試験においてプラセボ群の累積 HIV 発生率を推定し、その有効性を評価する新しいアプローチを提案しています。
この論文は、調査データにおける項目非回答の処理に用いる線形回帰補完法のための変数選択問題に取り組み、オラクル損失関数に基づく最適モデルの定義、モデル誤指定の影響の分析、およびモデル選択後の信頼区間構築のための完全な方法論的枠組みを提案し、その漸近的妥当性と有限サンプルにおける優れた性能を実証しています。
複数の視点から得られたデータに潜む真の共通クラスタ構造を、各視点のクラスタ数の合計を超える場合でも既存手法を上回る精度で回復し、モデル選択を容易にする新しい手法「KRAFTY」を提案する論文です。
この論文は、ケースワイズおよびセルワイズの両方の外れ値と欠損値に頑健であり、非対称分布への対応や頑健な外挿予測を可能にする新しい最小切り捨て二乗回帰法を提案し、シミュレーションおよび実データを用いてその性能を検証したものである。
本論文は、高コストな高忠実度シミュレーションと低コストな低忠実度シミュレーションの情報を組み合わせて大規模な時空間データを効率的に近似する「多忠実度テンソルエミュレータ」を開発し、北極海氷ダイナミクスの解析において予測精度と不確実性の低減を実現したことを報告しています。
本論文は、高頻度観測データにおける外れ値の影響を低減するため、Kessler 法によるガウス近似と-divergence を用いた拡散過程の頑健な推定法を提案し、その漸近性質や条件付き影響関数の有界性を示すものである。
本論文は、実験データ分析で確立された ANOVA 同時成分分析(ASCA)を、複数の周期的スケールと自己相関といった時系列特有の課題に対処できるよう拡張し、山岳湖沼の水温や都市の花粉濃度といった実データを用いたケーススタディを通じて、その有効性を検証する統合的な分析パイプラインを提案するものである。
この論文は、平均だけでなく共分散構造の変化も検出する必要がある多チャンネルプロファイルの監視課題に対し、関数グラフモデルを用いて条件付き依存関係を解釈可能な形で表現し、異なる疎性レベルに対応する尤度比検定の非パラメトリックな組み合わせによって異常状態を検知する新しい管理図「MPC」を提案し、シミュレーションと実データによる有効性を示したものである。
本論文は、時系列データにおける因果構造学習の課題に対処するため、スコアベースの探索手法 BOSS を拡張した TS-BOSS を提案し、その理論的妥当性を証明するとともに、高自己相関環境下で既存の制約ベース手法を上回る性能を実証したものである。
本論文は、グラフ構造によって構成間の依存性を制御し、短距離・長距離の両方の依存性を単一のパラメータ族で記述できる高次元時系列モデル「レヴィ駆動グラフ supOU 過程」を提案し、その推定手法の理論的性質を確立するとともに、欧州の電力ネットワークにおける風力発電容量係数の実証分析を通じてその有用性を示しています。
この論文は、離散カイ二乗法(DCM)が従来のフーリエ変換などの制約を克服し、エルニーニョ現象を含む複雑な時系列データのトレンドと信号を検出・予測する革新的な手法であることを示しています。
この論文は、不均衡学習における合成データ拡張が常に有益とは限らず、データの局所的な対称性や生成器の誤差の方向性によって効果や最適な生成数が変化することを統計的に示し、検証損失を最小化する「検証チューニング合成サイズ(VTSS)」を推奨する枠組みを提案しています。
この論文は、個々の人間や LLM エージェントが持つ断片的な因果知識を、大規模なクラウドソーシングや対話型知識抽出、堅牢な集約手法、そして LLM によるシミュレーションを統合した新しいパラダイムを通じて統合し、単独では達成不可能な大規模な因果構造(DAG)の復元を可能にする包括的な研究枠組みを提案するものである。
本論文は、バイアス・バリアンス分析と分割法を統合し、経験的有効次元の概念を導入することで、カーネル基底勾配法に対して最適な汎化誤差 bound を達成する適応的パラメータ選択戦略を提案し、その理論的妥当性を学習理論の枠組みで厳密に証明したものである。
本論文は、混合ガウス潜在事前分布とデータタイプ固有のデコーダを結合し、重なり、交絡、治療効果の不均一性を独立に制御可能な変分生成フレームワーク「CausalMix」を提案することで、因果推論における現実的な合成データ生成と因果メカニズムの精密な操作という課題を解決したものである。
この論文は、フラッシュ刺激下での脳波(EEG)解析に応用される投影等方正規分布の新たな性質を導出し、その平均結果ベクトル分布の近似法を提案するとともに、実際の脳波データを用いて推論手法の妥当性を検証するものである。