Estimation of heterogeneous principal effects under principal ignorability

この論文は、主無視仮定の下で二値の処置と中間変数を扱う場合の異質的主因果効果を推定・推測するための枠組みを提案し、二重頑健性やその中間的な頑健性を持つ複数の推定量を開発するとともに、非パラメトリックな滑らかさの条件や高次元設定における大標本理論を確立し、Camden Coalition のランダム化試験を用いた実証分析を通じてこれらの手法の有用性を示しています。

Rui Zhang, Charles R. Doss, Jared D. HulingWed, 11 Ma📊 stat

Data-driven robust Markov decision processes on Borel spaces: performance guarantees via an axiomatic approach

本論文は、未知の擾乱分布を持つマルコフ決定過程に対して、経験分布からの距離関数の副レベル集合を曖昧集合として定義するデータ駆動型のロバストアプローチを提案し、その最適値関数が真の最適値関数に収束することや、有限サンプル数においてアウトオブサンプル性能の確率的な上界となることを証明しています。

Sivaramakrishnan RamaniWed, 11 Ma🤖 cs.LG

Verifying Good Regulator Conditions for Hypergraph Observers: Natural Gradient Learning from Causal Invariance via Established Theorems

この論文は、コンタント・アシュビーの良き調節器定理、情報幾何学、およびアマリの定理といった確立された定理を用いて、ワルフラムの超グラフ物理学とバンチュリンの神経網宇宙論を統合し、因果不変な超グラフ基盤における持続的観測者が自然勾配学習に従うことを示し、観測者がフィッシャー計量の固有方向ごとに異なるバンチュリンのレジームに同時に存在し得ることを明らかにしています。

Max ZhuravlevWed, 11 Ma🤖 cs.LG

A Generative Sampler for distributions with possible discrete parameter based on Reversibility

この論文は、詳細平衡条件に基づく時間反転対称性を統計的制約として利用し、目標分布の勾配や連続緩和を必要とせずに、連続・離散・混合変数を含む多様な状態空間における平衡サンプリングを可能にする統一的な生成サンプリング枠組みを提案するものである。

Lei Li, Zhen Wang, Lishuo ZhangWed, 11 Ma🤖 cs.LG

Transductive Generalization via Optimal Transport and Its Application to Graph Node Classification

この論文は、最適輸送を用いて学習済み表現間のワッサーシュタイン距離に基づく新しい転移学習汎化誤差 bound を導出し、グラフノード分類において従来の複雑性尺度よりも実証的な汎化性能と強く相関し、GNN の深さと汎化誤差の非単調な関係を説明する理論的枠組みを提案しています。

MoonJeong Park, Seungbeom Lee, Kyungmin Kim, Jaeseung Heo, Seunghyuk Cho, Shouheng Li, Sangdon Park, Dongwoo KimWed, 11 Ma🤖 cs.LG

Robust Regularized Policy Iteration under Transition Uncertainty

この論文は、オフライン強化学習における分布シフトと遷移の不確実性を統一的に扱うため、最悪ケースのダイナミクスに対するロバストな方策最適化を提案し、KL 正則化を用いた実用的な反復アルゴリズム「RRPI」を開発して D4RL ベンチマークで優れた性能とロバスト性を示したことを述べています。

Hongqiang Lin, Zhenghui Fu, Weihao Tang, Pengfei Wang, Yiding Sun, Qixian Huang, Dongxu ZhangWed, 11 Ma🤖 cs.AI

Variational Routing: A Scalable Bayesian Framework for Calibrated Mixture-of-Experts Transformers

この論文は、大規模な基礎モデルにおける不確実性の定量化と計算コストの両立を実現するため、混合専門家(MoE)層のルーティング段階にベイズ推論を限定した「変分混合専門家ルーティング(VMoER)」を提案し、較正誤差の大幅な削減と分布外データに対する性能向上を、計算コストの増加を最小限に抑えながら達成することを示しています。

Albus Yizhuo Li, Matthew WickerWed, 11 Ma🤖 cs.AI

What Do We Care About in Bandits with Noncompliance? BRACE: Bandits with Recommendations, Abstention, and Certified Effects

この論文は、非遵守(noncompliance)が存在するバンドット問題において推奨と処置の目的が一致しない課題を定式化し、IV 推定量の信頼性を保証する「BRACE」というパラメータフリーのアルゴリズムを提案するとともに、その理論的保証と多様なシナリオにおける実証的有効性を示しています。

Nicolás Della PennaWed, 11 Ma🤖 cs.LG

MM-algorithms for traditional and convex NMF with Tweedie and Negative Binomial cost functions and empirical evaluation

この論文は、過分散や複雑な平均分散関係を持つデータに対応するため、Tweedie 分布や負の二項分布などの広範な分布仮定に基づき、従来の NMF と凸 NMF の両方に対して Majorize-Minimisation 法を用いた統一的な乗法更新アルゴリズムを開発し、実データを用いた評価を通じてノイズモデルの選択の重要性と凸 NMF の有効性を示したものです。

Elisabeth Sommer James, Asger Hobolth, Marta PelizzolaWed, 11 Ma🤖 cs.LG

Upper Generalization Bounds for Neural Oscillators

本論文は、Rademacher 複雑性を用いて第二階 ODE と MLP からなるニューラル振動子の PAC 一般化誤差上限を導出・解析し、誤差がパラメータ数に対して多項式的に増加することや、MLP のリプシッツ定数を正則化することで一般化性能が向上することを理論的に示し、Bouc-Wen 非線形系を用いた数値実験でその有効性を検証したものである。

Zifeng Huang, Konstantin M. Zuev, Yong Xia, Michael BeerWed, 11 Ma🤖 cs.LG

A Unified Hierarchical Multi-Task Multi-Fidelity Framework for Data-Efficient Surrogate Modeling in Manufacturing

本論文は、製造システムにおける異質な多忠実度データを活用し、タスク間の類似性と忠実度依存の不確実性を統合的に学習することで予測精度を大幅に向上させる、階層的なマルチタスク・マルチ忠実度ガウス過程代理モデル枠組みを提案しています。

Manan Mehta, Zhiqiao Dong, Yuhang Yang, Chenhui ShaoWed, 11 Ma🤖 cs.LG

On the Width Scaling of Neural Optimizers Under Matrix Operator Norms I: Row/Column Normalization and Hyperparameter Transfer

この論文は、行列演算子ノルムの幾何学的解釈に基づき、層ごとの合成性と幅に依存しない滑らかさの保証を実現する新しい平均正規化ノルムを導入し、これによりモデル幅を超えた学習率の安定した転送を可能にする新しい最適化手法「MOGA」を提案し、大規模な事前学習実験で Muon と同等以上の性能と高速性を示したことを報告しています。

Ruihan Xu, Jiajin Li, Yiping LuWed, 11 Ma🤖 cs.LG

Online Neural Networks for Change-Point Detection

この論文では、大規模な時系列データに対して線形計算量で実行可能かつ最適解への収束が証明された、ニューラルネットワークとオンライン学習に基づく 2 つの新しい変化点検出手法を提案し、既存の手法を上回る性能を実証するとともに、オフライン手法よりも優れる条件を明らかにしています。

Mikhail Hushchyn, Kenenbek Arzymatov, Denis DerkachTue, 10 Ma🤖 cs.LG