Post-Experiment Decisions: The Dual Adjustments for Rollout and Downstream Optimizations
この論文は、不確実な実験結果に基づく意思決定における過大・過小評価の非対称なコストを考慮し、ロールアウトと下流最適化の両方に対してデータに依存しない調整を加える「PATRO」という手法を提案し、それがベイズ最適基準に近い性能を発揮することを示しています。
252 件の論文
この論文は、不確実な実験結果に基づく意思決定における過大・過小評価の非対称なコストを考慮し、ロールアウトと下流最適化の両方に対してデータに依存しない調整を加える「PATRO」という手法を提案し、それがベイズ最適基準に近い性能を発揮することを示しています。
この論文は、次元が発散する高次元環境における非退化な U-統計量に対して、多項式成長の下で誤差が消失する強ガウス近似を確立し、その技術的核となる完全退化 U-統計量の鋭いマルチンゲール極大不等式を用いて、重尾分布下でも有効な高次元推論のための統一的な確率論的基盤を提供するものです。
この論文は、モデル依存や分布の仮定に依存しない「コンフォーマル予測」を用いて、日本とカナダの地域別年齢別死亡率という高次元関数時系列データに対する予測区間を構築し、分割法と逐次法の性能を比較評価する手法を提案しています。
この方法論的レビューは、診断精度メタ分析における異質性の調査が頻繁に行われているものの、統計モデルの報告が不明確な場合が多く、プロトコルでの事前計画の徹底が透明性向上に重要であることを示しています。
この論文は、理論的な多様体から実用的な計算ワークフローへの移行を困難にしているケンドール 3 次元形状空間の幾何学的構造分析の課題に対し、Geomstats には不足している高度な 3 次元形状分析のためのユーティリティを提供し、複雑な数学的抽象概念を研究者向けに効率的かつアクセスしやすいソフトウェアソリューションへと変換する Python 実装ツールを紹介するものである。
本論文は、Fashion-MNIST データセットを用いた実験を通じて、H-CNN VGG16 と GoogLeNet の二つのアーキテクチャにおけるモンテカルロドロップアウトとコンフォーマル予測による不確実性推定を比較し、GoogLeNet がより適切に較正された不確実性を示し、コンフォーマル予測が統計的に保証された予測セットを提供することで高リスクな意思決定における信頼性の向上に寄与することを明らかにしています。
本論文は、円形信号における複数の変化点を検出するための新しい手法「PCID」を提案し、対比関数と置換検定を用いたオフライン検出法が、フォン・ミーゼス分布の仮定を超えて多様なノイズ構造や実データに対しても頑健に機能することを示しています。
ReTabSyn は、強化学習を用いて特徴量間の相関を直接評価し、条件付き分布の学習を優先させることで、データ不足や不均衡といった制約下でも下流タスクの性能を向上させる現実的な表形式データ合成パイプラインを提案するものである。
この論文は、胃癌の臨床試験を動機として、外部データと標的集団の共変量分布の適合度に基づいて個別に重み付けを行う個人重み付けモデルを提案し、部分的情報借用を用いた精密試験のベイズ設計・分析枠組みを構築し、シミュレーションを通じてその性能を検証するものである。
この論文は、単なるコードの公開を超えて、データ分析の論理的構成を形式化して表現することで、分析者の推論を可視化し、データなしで分析の質や仮定の感度を評価可能にする手法の実装と応用について論じています。
この論文は、検診プログラムの効果評価における精度向上のために、従来の手法では利用されなかったデータも活用する「リスク時間の分割」法を詳細に解説し、最尤法を追加して広く普及させる基盤を築き、ノルウェーとデンマークのデータを用いた適用により、他の手法に比べて信頼区間が大幅に狭くなることを示しています。
この論文は、従来の適合度検定の限界を克服し、分布間の統計的に意味のある差異の不在を評価するための、カーネル・スタイン不一致と最大平均不一致を用いた新しい等価性検定手法を提案し、その漸近正規性近似およびブートストラップ法に基づく臨界値の計算方法を提示しています。
ICH E9(R1) の推定量(estimand)の枠組みが非劣性マージンの選択に与える影響を重量管理シミュレーションを通じて検証し、歴史的データと計画された研究の推定量の整合性がマージン決定において重要な課題であることを示しています。
この論文は、研究間の異質性に応じてデータセット間の共有情報を適応的に調整し、KL 発散ペナルティを用いた新しい「重心」分布への縮小推定を導入することで、従来の「全か無か」の二元論的アプローチの限界を克服し、推定精度と統計的推論の両方を改善するメタ分析フレームワークを提案するものである。
この論文は、非パラメトリックな分布仮定や小標本サイズの問題を解決し、学習率の較正によって頻度論的な被覆率を保証しつつ、従来の非パラメトリック手法よりも短い許容区間を構築する、較正されたギブス事後分布に基づく新しいアプローチを提案しています。
この論文は、合成データが訓練データに含まれる個人を特定する「メンバーシップ推論攻撃」にどの程度脆弱かを評価するため、カーネル密度推定を用いた実用的なリスク定量化手法を提案し、既存の手法よりも高い精度でリスクを評価できることを示しています。
本論文は、条件付独立性の検定に用いられる部分コピュラを再考し、それを共変量の影響を除いた後の変数間の依存性を表す非線形な偏相関として位置づけ、条件付コピュラの依存性特性が部分コピュラの形式を制約することを証明するとともに、シミュレーションを通じて因果推論における真の因果効果の符号の回復への可能性を示しています。
本論文は、高リスクな応用において質量スペクトルからの分子構造推定の信頼性を確保するため、不確実性が高い場合に予測を保留する選択的予測フレームワークを提案し、MassSpecGym ベンチマークを用いた評価により、計算コストの低い信頼度指標や検索レベルの偶然的不確実性がリスク・カバレッジのトレードオフにおいて優れていることを示しています。
本論文では、テスト時スケーリング下での推論 LLM のランキング手法を体系化し、統計的ランキング法を実装したオープンソースライブラリ「Scorio」を提案するとともに、複数のベンチマークにおけるその有効性を検証しました。
この論文は、プラットフォーム試験における非同時対照群のプールがバイアスを誘発する可能性や効率性向上の限界を明らかにし、同時対照群のみを用いた共変量調整二重頑健推定量が、生存時間データに基づく因果推論において最も堅牢な精度向上策であることを示しています。