Enabling stratified sampling in high dimensions via nonlinear dimensionality reduction

この論文は、ニューラルネットワークに基づく非線形次元削減手法「ニューラル・アクティブ・多様体」を用いて高次元入力空間をモデルの応答に適合した一次元潜在空間へ変換し、その上で層化サンプリングを行うことで、高次元における計算コストの高いモデルの確率的不確実性伝播における分散を効果的に低減する手法を提案しています。

Gianluca Geraci, Daniele E. Schiavazzi, Andrea Zanoni2026-03-06🔢 math

Bures-Wasserstein Flow Matching for Graph Generation

本論文は、グラフ生成モデルにおけるノードとエッジの連動した進化を可能にするマルコフ確率場に基づく最適輸送の概念を導入し、滑らかな確率経路を構築することで訓練の収束性とサンプリング効率を向上させる「BWFlow」という新しいフローマッチングフレームワークを提案しています。

Keyue Jiang, Jiahao Cui, Xiaowen Dong + 1 more2026-03-06💻 cs

Quantitative convergence of trained single layer neural networks to Gaussian processes

この論文は、無限幅極限における勾配降下法で学習された単層ニューラルネットワークの出力とガウス過程との間の二次ワッサーシュタイン距離に多項式減衰を示す明示的な上限を与えることで、訓練中の有限幅ネットワークのガウス過程への収束を定量的に評価するものである。

Eloy Mosig, Andrea Agazzi, Dario Trevisan2026-03-06🔢 math

Non-Asymptotic Analysis of Efficiency in Conformalized Regression

本論文は、SGD で学習されたコンフォーマル化回帰(分位点および中央値回帰)の予測セットの長さがオラクル区間の長さから逸脱する非漸近的な誤差を、訓練データ数、較正データ数、および誤覆率α\alphaの関数として評価し、α\alphaの異なる領域における収束率の位相転移を明らかにすることで、予測セットの冗長度を制御するためのデータ配分の指針を提供する。

Yunzhen Yao, Lie He, Michael Gastpar2026-03-06💻 cs

Generalization Below the Edge of Stability: The Role of Data Geometry

本論文は、過剰パラメータ化された 2 層 ReLU ネットワークにおけるデータ幾何学的構造が、安定性の限界以下での学習ダイナミクスを通じて、モデルが共有パターンを捉える一般化解か、あるいは過学習に陥る解のどちらを選択するかを決定づけることを理論的に示したものである。

Tongtong Liang, Alexander Cloninger, Rahul Parhi + 1 more2026-03-06💻 cs

A Bayesian approach to learning mixtures of nonparametric components

この論文は、ベイズ非パラメトリック手法を用いて有限混合モデルの各成分を非パラメトリックに学習する枠組みを提案し、成分分布の識別可能性と事後収束性を理論的に証明するとともに、効率的な MCMC アルゴリズムを開発してシミュレーションおよび実データでその有効性を示しています。

Yilei Zhang, Yun Wei, Aritra Guha + 1 more2026-03-06🔢 math

Towards Sharp Minimax Risk Bounds for Operator Learning

本論文は、ヒルベルト空間間の未知作用素を有限のノイズ入り入力出力サンプルから推定する問題におけるミニマックスリスクの理論を構築し、リプシッツ連続作用素に対してサンプルサイズの代数的な減少率ではリスクが収束しない「サンプル複雑性の呪い」が示されることを明らかにしています。

Ben Adcock, Gregor Maier, Rahul Parhi2026-03-06🔢 math

Latent-IMH: Efficient Bayesian Inference for Inverse Problems with Approximate Operators

本論文は、計算コストの高い演算子を含むベイズ線形逆問題において、近似演算子を用いた中間変数の生成と正確な演算子による精緻化を組み合わせる「Latent-IMH」というサンプリング手法を提案し、その理論的解析と数値実験を通じて、NUTS などの既存手法を凌駕する計算効率を実証するものである。

Youguang Chen, George Biros2026-03-06🔢 math

YuriiFormer: A Suite of Nesterov-Accelerated Transformers

本論文は、トランスフォーマー層を最適化アルゴリズムの反復として解釈する変分枠組みを提案し、これに基づいてナステロフ加速法を導入した「YuriiFormer」を開発することで、TinyStories や OpenWebText などのタスクにおいて nanoGPT ベースラインを上回る性能を達成したことを示しています。

Aleksandr Zimin, Yury Polyanskiy, Philippe Rigollet2026-03-06🔢 math

Optimal training-conditional regret for online conformal prediction

この論文は、分布のドリフトが発生する非定常データストリームにおけるオンライン共形予測の訓練条件付き累積後悔を最小化し、分布シフト検出を組み込んだ分割共形法およびフル共形法によって、それぞれ最小最大最適性の後悔保証を達成する手法を提案し、理論的保証と数値実験でその有効性を示したものである。

Jiadong Liang, Zhimei Ren, Yuxin Chen2026-03-06🔢 math

Conformal Graph Prediction with Z-Gromov Wasserstein Distances

本論文は、グラフ出力に対する分布フリーの被覆保証を提供するため、Z-グロモフ・ワッサーシュタイン距離(実装上は FGW)に基づく非適合度定義と、グラフ空間に対応した適応的予測集合を得るためのスコア・コンフォーマライズド量子回帰(SCQR)を組み合わせた、新しいコンフォーマル予測フレームワークを提案しています。

Gabriel Melo, Thibaut de Saivre, Anna Calissano + 1 more2026-03-06💻 cs

Machine Learning for Complex Systems Dynamics: Detecting Bifurcations in Dynamical Systems with Deep Neural Networks

この論文は、候補となる平衡状態を入力としてシステムパラメータを推論する「平衡情報ニューラルネットワーク(EINN)」という深層学習手法を提案し、複雑な力学系における臨界遷移や分岐を従来の数値シミュレーションよりも効率的に検出できることを示しています。

Swadesh Pal, Roderick Melnik2026-03-06🔢 math

Dictionary Based Pattern Entropy for Causal Direction Discovery

この論文は、記号列の因果方向発見のためにアルゴリズム情報理論とシャノン情報理論を統合し、候補原因におけるコンパクトな規則パターンが結果変数をどのように制約するかを辞書ベースのパターンエントロピー(DPE)で定量化する新しい枠組みを提案し、多様な合成および実データセットにおいて既存手法を上回る性能を実証したものである。

Harikrishnan N B, Shubham Bhilare, Aditi Kathpalia + 1 more2026-03-06🔢 math