stat.ML 件の論文 | Gist.Science

On-Average Stability of Multipass Preconditioned SGD and Effective Dimension

本論文は、データ再利用による相関を扱う新たな平均安定性解析手法を開発し、多パス前処理付き確率勾配降下法（PSGD）の汎化性能が、人口リスクの曲率と勾配ノイズの幾何学的な不一致によって決まる「有効次元」に依存することを示し、不適切な前処理が最適化と汎化の両面で性能を劣化させることを証明しています。

Simon Vary, Tyler Farghly, Ilja Kuzborskij, Patrick RebeschiniFri, 13 Ma📊 stat

BTZSC: A Benchmark for Zero-Shot Text Classification Across Cross-Encoders, Embedding Models, Rerankers and LLMs

本論文は、従来の NLI ベースのモデルに加え、埋め込みモデルやリランカー、大規模言語モデルを含む多様なゼロショットテキスト分類アプローチを公平に評価するための包括的ベンチマーク「BTZSC」を提案し、最新の 8B パラメータのリランカーが最高性能を達成しつつ、埋め込みモデルが精度と遅延のバランスにおいて優位であることを示しています。

Ilias AarabFri, 13 Ma💬 cs.CL

Chemical Reaction Networks Learn Better than Spiking Neural Networks

この論文は、隠れ層を持たない化学反応ネットワークが、隠れ層を必要とするスパイクニューラルネットワークよりも優れた学習能力と分類精度を数学的に証明し、生化学的反応ネットワークが生物学的学習においてより効率的である可能性を示唆しています。

Sophie Jaffard, Ivo F. SbalzariniFri, 13 Ma📊 stat

Wasserstein Gradient Flows for Batch Bayesian Optimal Experimental Design

本論文は、バッチベイズ最適実験設計における非凸な最適化課題に対処するため、設計測度空間への確率的リフティングとエントロピー正則化を導入し、Wasserstein 勾配流に基づく粒子アルゴリズムを提案して、多峰性の最適化 landscapes を探索し高効用な実験バッチを効率的に生成する手法を確立したものである。

Louis SharrockFri, 13 Ma📊 stat

A Quantitative Characterization of Forgetting in Post-Training

この論文は、二成分混合モデルを用いた理論的枠組みを構築し、KL 発散の方向性、幾何学的な行動の重なり、サンプリング戦略、および過去の行動の可視性が、生成モデルの継続的学習における「質量の消失」と「成分のドリフト」という 2 種類の忘却をどのように定量的に決定するかを明らかにしています。

Krishnakumar Balasubramanian, Shiva Prasad KasiviswanathanFri, 13 Ma📊 stat

Riemannian Laplace Approximation with the Fisher Metric

この論文は、フィッシャー計量を用いたリーマン・ラプラス近似が無限データ極限においてもバイアスや過剰な狭さという欠点を持つことを示し、これを修正する 2 つの新しい変法を開発して理論的解析を深め、実験を通じてその実用性の向上を実証しています。

Hanlin Yu, Marcelo Hartmann, Bernardo Williams + 2 more2026-03-12🤖 cs.LG

Logarithmic Regret for Online KL-Regularized Reinforcement Learning

本論文は、KL 正則化がもたらす最適化の利点と楽観的報酬推定を巧みに組み合わせることで、オンライン文脈付きバンドットおよび強化学習において対数 regret 境界を達成する新しいアルゴリズムとその理論的解析を提案しています。

Heyang Zhao, Chenlu Ye, Wei Xiong + 2 more2026-03-12📊 stat

Geopolitics, Geoeconomics, and Sovereign Risk: Different Shocks, Different Channels

この論文は、地政学的ショックが直接デフォルトリスクを通じて、地経済的ショックが金融サイクルや政策期待を通じてそれぞれ異なる経路で主権リスクに影響を与える「ハサミ型」のパターンを、2018 年から 2025 年の 42 カ国のデータと機械学習を用いた分析によって実証し、両者のメカニズムの区別が流動性供給の効果範囲を決定づけることを明らかにしている。

Alvaro Ortiz, Tomasa Rodrigo, Pablo Saborido2026-03-12📊 stat

A Bandit-Based Approach to Educational Recommender Systems: Contextual Thompson Sampling for Learner Skill Gain Optimization

この論文は、オンライン数学チューティングプラットフォームのデータを用いて、学習者のスキル向上を最大化する個人向け演習シーケンスを生成する文脈的トンプソンサンプリングに基づくバンドットアプローチを提案し、その有効性とスケーラブルな個人化学習の可能性を実証しています。

Lukas De Kerpel, Arthur Thuy, Dries F. Benoit2026-03-12📊 stat

SSRCA: a novel machine learning pipeline to perform sensitivity analysis for agent-based models

本論文では、計算コストが高く複雑なエージェントベースモデルの感度分析を容易にするため、機械学習に基づく「SSRCA」という新規パイプラインを開発し、腫瘍球成長モデルを用いた実証により、従来のソボル法よりもロバストな感度パラメータの特定と出力パターンの分類が可能であることを示しています。

Edward H. Rohr, John T. Nardini2026-03-11🧬 q-bio

Accounting for shared covariates in semi-parametric Bayesian additive regression trees

この論文は、線形予測子と BART 成分の共分散を共有する際に生じる識別不能性やバイアスを、木生成の移動を改良することで解決し、主要な共変量間の複雑な相互作用をモデル化可能にする半パラメトリック・ベイズ加性回帰木（BART）の拡張手法を提案し、教育評価データやベンチマークデータを用いた検証でその有効性を示したものである。

Estevão B. Prado, Andrew C. Parnell, Keefe Murphy + 3 more2026-03-10🤖 cs.LG

Convergence and complexity of block majorization-minimization for constrained block-Riemannian optimization

本論文は、リーマン多様体上の制約付きブロック最適化問題に対するブロック主要化最小化法（BMM）の収束性と複雑さを解析し、非凸目的関数に対して定常点への収束と $\widetilde{O}(\epsilon^{-2})$ の反復回数による $\epsilon$ -定常点の到達を保証するとともに、多様なアルゴリズムへの適用性と標準的なユークリッド法に対する実験的な優位性を示しています。

Yuchen Li, Laura Balzano, Deanna Needell + 1 more2026-03-10📊 stat

Zeroth-Order primal-dual Alternating Projection Gradient Algorithms for Nonconvex Minimax Problems with Coupled linear Constraints

本論文は、機械学習や信号処理などの分野で注目されている連束線形制約付き非凸最小最大問題に対し、決定論的および確率的設定において反復複雑性の保証を持つ初のゼロ次順序アルゴリズム（ZO-PDAPG および ZO-RMPDPG）を提案し、その収束性を証明するとともに、既存の手法を上回る性能を達成したことを示しています。

Huiling Zhang, Zi Xu, Yuhong Dai2026-03-06🔢 math

← 前へ次へ →

stat.ML

On-Average Stability of Multipass Preconditioned SGD and Effective Dimension

BTZSC: A Benchmark for Zero-Shot Text Classification Across Cross-Encoders, Embedding Models, Rerankers and LLMs

Chemical Reaction Networks Learn Better than Spiking Neural Networks

Wasserstein Gradient Flows for Batch Bayesian Optimal Experimental Design

A Quantitative Characterization of Forgetting in Post-Training

Riemannian Laplace Approximation with the Fisher Metric

Logarithmic Regret for Online KL-Regularized Reinforcement Learning

Geopolitics, Geoeconomics, and Sovereign Risk: Different Shocks, Different Channels

A Bandit-Based Approach to Educational Recommender Systems: Contextual Thompson Sampling for Learner Skill Gain Optimization

SSRCA: a novel machine learning pipeline to perform sensitivity analysis for agent-based models

Accounting for shared covariates in semi-parametric Bayesian additive regression trees

Convergence and complexity of block majorization-minimization for constrained block-Riemannian optimization

Zeroth-Order primal-dual Alternating Projection Gradient Algorithms for Nonconvex Minimax Problems with Coupled linear Constraints

Towards a Fairer Non-negative Matrix Factorization

An Experimental Study on Fairness-aware Machine Learning for Credit Scoring Problems

Curse of Dimensionality in Neural Network Optimization

Generalization Bounds for Markov Algorithms through Entropy Flow Computations

Double Momentum and Error Feedback for Clipping with Fast Rates and Differential Privacy

Variational Formulation of Particle Flow

Ice Cream Doesn't Cause Drowning: Benchmarking LLMs Against Statistical Pitfalls in Causal Inference