Nuisance Function Tuning and Sample Splitting for Optimally Estimating a Doubly Robust Functional

この論文は、因果推論や条件付き独立性検出の分野で応用される二重ロバスト関数の推定において、サンプル分割と nuisance 関数のチューニング戦略を適切に組み合わせることで、低正則性条件下でも plug-in 推定量や第一-order 補正推定量がすべての H ölder 滑らかさクラスに対して最小最大収束率を達成し得ることを示しています。

Sean McGrath, Rajarshi MukherjeeTue, 10 Ma🔢 math

Mini-batch Estimation for Deep Cox Models: Statistical Foundations and Practical Guidance

本論文は、深層コックスモデルにおけるミニバッチ確率的勾配降下法(SGD)の統計的基盤を確立し、新しい推定量(mb-MPLE)の一貫性と収束性を証明するとともに、学習率とバッチサイズの比率の重要性や大規模実データへの適用可能性など、実用的な指針を提供しています。

Lang Zeng, Weijing Tang, Zhao Ren, Ying DingTue, 10 Ma🤖 cs.LG

Variational Learning of Gaussian Process Latent Variable Models through Stochastic Gradient Annealed Importance Sampling

この論文は、高次元空間や複雑なデータにおける提案分布の生成が困難という既存のベイズ GPLVM の課題を解決するため、変分推論と Annealed Importance Sampling を組み合わせ、すべての変数を再パラメータ化することで効率的な学習を実現し、より tight な変分境界や高い対数尤度、頑健な収束性を実現する手法を提案しています。

Jian Xu, Shian Du, Junmei Yang, Qianli Ma, Delu Zeng, John PaisleyTue, 10 Ma🤖 cs.LG

BNEM: A Boltzmann Sampler Based on Bootstrapped Noised Energy Matching

本論文は、ボルツマン分布からの効率的なサンプリングを目的として、ノイズ付きエネルギーの学習に基づく拡散サンプリング手法「NEM」と、そのバイアスと分散を調整するブートストラップ技術を組み合わせた「BNEM」を提案し、複雑な分布における最先端の性能と頑健性を示しています。

RuiKang OuYang, Bo Qiang, José Miguel Hernández-LobatoTue, 10 Ma🤖 cs.LG

Active Advantage-Aligned Online Reinforcement Learning with Offline Data

この論文は、オンライン RL とオフライン RL の長所を組み合わせる際に生じる課題を解決するため、方策の進化するニーズに合わせたデータを動的に優先する「自信あり能動利得整合(A3)」サンプリング戦略を採用した新しい手法 A3RL を提案し、その有効性を理論的および実証的に示したものである。

Xuefeng Liu, Hung T. C. Le, Siyu Chen, Rick Stevens, Zhuoran Yang, Matthew R. Walter, Yuxin ChenTue, 10 Ma🤖 cs.LG

Adaptive Replication Strategies in Trust-Region-Based Bayesian Optimization of Stochastic Functions

この論文は、分散の大きい確率関数の最適化において、ガウス過程モデルと信頼領域枠組みを組み合わせ、評価回数を適動的に増やす複製戦略を導入することで、解の精度と計算効率を大幅に向上させる手法を提案し、数値実験でその有効性を示しています。

Mickael Binois (ACUMES), Jeffrey Larson (ANL)Tue, 10 Ma🔢 math

Online Decision-Focused Learning

この論文は、目的関数やデータ分布が時間とともに変化する動的環境におけるオンライン意思決定指向学習(DFL)の問題を扱い、目的関数の微分可能性を確保するための正則化と摂動手法を組み合わせることで、初めてこの問題に対する静的および動的後悔の理論的保証を提供するアルゴリズムを提案し、その有効性を示しています。

Aymeric Capitaine, Maxime Haddouche, Eric Moulines, Michael I. Jordan, Etienne Boursier, Alain DurmusTue, 10 Ma🤖 cs.LG

Synthetic data for ratemaking: imputation-based methods vs adversarial networks and autoencoders

この論文は、保険料率設定におけるデータ不足やプライバシー問題への対応策として、MICE 法が深層生成モデル(VAE や CTGAN)と同等以上のデータ忠実度と GLM 予測性能を維持しつつ、実装の容易さにおいて優位であることを示す比較研究をまとめたものである。

Yevhen Havrylenko, Meelis Käärik, Artur TuttarTue, 10 Ma🤖 cs.LG

Faster Gradient Methods for Highly-Smooth Stochastic Bilevel Optimization

本論文は、上段非凸・下段強凸の確率的バイレベル最適化問題において、高次滑らかさを活用して超勾配を近似する高次有限差分法 F²SA-ppを提案し、その収束率を改善するとともに、下界がΩ(ϵ4)\Omega(\epsilon^{-4})であることを示すことで、高次滑らかさの領域においてこの手法がほぼ最適であることを証明しています。

Lesi Chen, Junru Li, El Mahdi Chayti, Jingzhao ZhangTue, 10 Ma🤖 cs.LG

Fast reconstruction of degenerate populations of conductance-based neuron models from spike times

この論文は、スパイクタイミングから深層学習と動的入力コンダクタンス(DIC)の理論的枠組みを組み合わせることで、神経の退化性(多様なイオンチャネル導電性の組み合わせが同様の活動を生む現象)を考慮しつつ、導電性ベースのニューロンモデルの生物物理パラメータを高速かつ効率的に再構築する手法を提案し、スパイク記録から機械的なモデルへの解釈可能な橋渡しを実現したものである。

Julien Brandoit, Damien Ernst, Guillaume Drion, Arthur FyonTue, 10 Ma🤖 cs.LG

GDR-learners: Orthogonal Learning of Generative Models for Potential Outcomes

この論文は、観測データから潜在結果の分布を推定する際に、準オラクル効率性と二重頑健性という望ましい理論的性質を持つ、条件付き正規化フローや拡散モデルなどの最先端生成モデルを汎用的に実装できる「GDR-learners」という新しい学習フレームワークを提案し、既存手法を上回る性能を実証しています。

Valentyn Melnychuk, Stefan FeuerriegelTue, 10 Ma🤖 cs.LG

An Orthogonal Learner for Individualized Outcomes in Markov Decision Processes

この論文は、観測データを用いたマルコフ決定過程における個別化潜在結果の推定問題に対し、二重頑健性、ネイマン直交性、準オラクル効率性という優れた理論的性質を備え、任意の機械学習モデルと組み合わせ可能な新しいメタ学習器「DRQ-learner」を提案し、その有効性を理論的および実験的に実証したものである。

Emil Javurek, Valentyn Melnychuk, Jonas Schweisthal, Konstantin Hess, Dennis Frauen, Stefan FeuerriegelTue, 10 Ma🤖 cs.LG