stat.ML 篇论文 | Gist.Science

Towards Reliable Simulation-based Inference

这篇论文探讨了基于模拟的统计推断中机器学习近似导致的过度自信问题，并提出了“平衡”正则化方法和针对该场景定制的贝叶斯神经网络两种解决方案，以增强推断结果的可靠性与校准性。

Estimation of heterogeneous principal effects under principal ignorability

本文提出了一种在主要可忽略性假设下估计和处理异质性主要因果效应（包括二元处理与二元中介变量情形）的框架，开发了具有不同稳健性特征的多种估计量并建立了大样本理论，同时利用 Camden Coalition 热点干预试验展示了该方法在估计异质性依从者效应中的应用。

Rui Zhang, Charles R. Doss, Jared D. HulingWed, 11 Ma📊 stat

Data-driven robust Markov decision processes on Borel spaces: performance guarantees via an axiomatic approach

本文提出了一种基于经验分布和距离函数子水平集构建模糊集的鲁棒马尔可夫决策过程（RMDP）框架，通过连接弱收敛与距离收敛，证明了该方法在有限样本下能提供高概率的出样本性能上界及收敛速率，并指出相比之下传统的经验 MDP 无法保证此类有限样本性能。

Sivaramakrishnan RamaniWed, 11 Ma🤖 cs.LG

Statistical Inference via Generative Models: Flow Matching and Causal Inference

本书将生成式人工智能重新诠释为统计框架下的高维概率分布非参数学习方法，以流匹配为核心，通过正交化和交叉拟合等技术，将缺失值填补、反事实分析及分布动力学等任务转化为可解释且具备统计推断有效性的科学问题。

Shinto EguchiWed, 11 Ma🤖 cs.LG

Verifying Good Regulator Conditions for Hypergraph Observers: Natural Gradient Learning from Causal Invariance via Established Theorems

该论文通过康特 - 阿什比好调节器定理，验证了因果不变超图基底中的持久观察者具备内部模型，进而推导出自然梯度下降作为唯一学习规则，并建立了沃尔夫拉姆超图物理与万丘林神经宇宙学之间的联系，同时指出了其关于收敛参数预测的模型依赖性。

Max ZhuravlevWed, 11 Ma🤖 cs.LG

Better Bounds for the Distributed Experts Problem

本文提出了一种新的分布式专家问题协议，通过优化通信量实现了比先前工作更优的遗憾界。

David P. Woodruff, Samson ZhouWed, 11 Ma🤖 cs.LG

A Generative Sampler for distributions with possible discrete parameter based on Reversibility

本文提出了一种基于可逆性约束的通用生成采样框架，通过最小化前向与后向马尔可夫轨迹间的最大均值差异（MMD）并仅依赖能量评估，成功解决了连续、离散及混合变量复杂分布的采样难题。

Lei Li, Zhen Wang, Lishuo ZhangWed, 11 Ma🤖 cs.LG

Transductive Generalization via Optimal Transport and Its Application to Graph Node Classification

该论文提出了一种基于最优传输的分布无关转导泛化界，通过计算编码特征分布间的 Wasserstein 距离，不仅提供了高效可计算且与图节点分类实证泛化性能强相关的理论界，还揭示了 GNN 聚合过程如何通过深度依赖的表征分布变换来解释深度与泛化误差之间的非单调关系。

MoonJeong Park, Seungbeom Lee, Kyungmin Kim, Jaeseung Heo, Seunghyuk Cho, Shouheng Li, Sangdon Park, Dongwoo KimWed, 11 Ma🤖 cs.LG

On Regret Bounds of Thompson Sampling for Bayesian Optimization

本文填补了高斯过程汤普森采样（GP-TS）在后悔界分析上的空白，通过证明其下界、二阶矩上界以及期望温和后悔界，并放宽了时间视界 $T$ 上累积后悔上界的推导条件，从而建立了多项式依赖 $\delta$ 的后悔下界及改进的累积后悔上界。

Shion Takeno, Shogo IwazakiWed, 11 Ma🤖 cs.LG

A Gaussian Comparison Theorem for Training Dynamics in Machine Learning

该论文基于高斯比较定理，建立了机器学习训练动力学与更易分析的对偶动力系统之间的非渐近联系，不仅严格证明了动态平均场理论在渐近场景下的有效性，还提出了一种迭代细化方案以在有限样本域中引入涨落参数从而获得更精确的训练演化描述。

Ashkan PanahiWed, 11 Ma🤖 cs.LG

Robust Regularized Policy Iteration under Transition Uncertainty

本文提出了一种名为鲁棒正则化策略迭代（RRPI）的新方法，通过将离线强化学习建模为在转移不确定性下的鲁棒策略优化问题，利用 KL 正则化将不可解的双层优化转化为可处理的单目标问题，从而在 D4RL 基准测试中实现了优于现有基线的性能并有效避免了分布外状态下的不可靠动作。

Hongqiang Lin, Zhenghui Fu, Weihao Tang, Pengfei Wang, Yiding Sun, Qixian Huang, Dongxu ZhangWed, 11 Ma🤖 cs.AI

Variational Routing: A Scalable Bayesian Framework for Calibrated Mixture-of-Experts Transformers

本文提出了变分混合专家路由（VMoER）框架，通过将贝叶斯推理限制在专家选择阶段，在几乎不增加计算成本的情况下，显著提升了大规模混合专家模型在不确定性量化、路由稳定性及分布外检测方面的表现。

Albus Yizhuo Li, Matthew WickerWed, 11 Ma🤖 cs.AI

What Do We Care About in Bandits with Noncompliance? BRACE: Bandits with Recommendations, Abstention, and Certified Effects

本文提出了 BRACE 算法，旨在解决带有不合规（Noncompliance）的 Bandit 问题中推荐福利与直接控制治疗目标不一致的矛盾，通过参数化相位倍增策略实现 IV 逆运算的矩阵认证与诚实结构区间估计，从而在保障统计有效性的同时，根据上下文同质性等条件灵活识别最优推荐或治疗策略。

Nicolás Della PennaWed, 11 Ma🤖 cs.LG

a-TMFG: Scalable Triangulated Maximally Filtered Graphs via Approximate Nearest Neighbors

该论文针对传统三角最大过滤图（TMFG）在处理大规模数据时因需预计算稠密相关矩阵而面临的内存与运行效率瓶颈，提出了一种结合 k 近邻图与按需估算缺失相关性的近似算法（a-TMFG），从而实现了在百万级观测数据集上高效构建用于机器学习任务的稀疏图结构。

Lionel YelibiWed, 11 Ma🤖 cs.LG

MM-algorithms for traditional and convex NMF with Tweedie and Negative Binomial cost functions and empirical evaluation

本文提出了一种基于 MM 算法的统一框架，用于在 Tweedie 和负二项分布等更广泛的噪声假设下推导传统及凸非负矩阵分解（NMF）的乘性更新规则，并通过实证研究验证了该框架在处理过离散数据及大规模类别场景下的优越性。

Elisabeth Sommer James, Asger Hobolth, Marta PelizzolaWed, 11 Ma🤖 cs.LG

Murmurations: a case study in AI-assisted mathematics

该论文报告了一种名为“ murmurations"（ murmurations）的全新算术现象，它通过机器学习可解释性工具在大规模算术数据中发现，并揭示了其与 Frobenius 迹、Birch 和 Swinnerton-Dyer 猜想及随机矩阵理论之间的深刻联系。

Yang-Hui He, Kyu-Hwan Lee, Thomas Oliver, Alexey PozdnyakovWed, 11 Ma📊 stat

Upper Generalization Bounds for Neural Oscillators

本文针对基于二阶常微分方程的神经振荡器，利用 Rademacher 复杂度框架推导了其泛化误差上界，证明了误差随网络规模和时长呈多项式增长且可通过正则化约束提升泛化能力，并通过 Bouc-Wen 非线性系统的数值实验验证了理论结果。

Zifeng Huang, Konstantin M. Zuev, Yong Xia, Michael BeerWed, 11 Ma🤖 cs.LG

A Unified Hierarchical Multi-Task Multi-Fidelity Framework for Data-Efficient Surrogate Modeling in Manufacturing

本文提出了一种基于高斯过程的统一分层多任务多保真度（H-MT-MF）框架，通过联合建模任务间相似性与保真度依赖性，有效解决了制造系统代理建模中数据需求大及多源异构数据利用不足的问题，显著提升了预测精度。

Manan Mehta, Zhiqiao Dong, Yuhang Yang, Chenhui ShaoWed, 11 Ma🤖 cs.LG

On the Width Scaling of Neural Optimizers Under Matrix Operator Norms I: Row/Column Normalization and Hyperparameter Transfer

该论文通过引入具有层可组合性的均值归一化算子范数，将 AdamW 和 Muon 等优化器统一为矩阵算子范数下的最速下降法，从而提出了能实现宽度无关平滑度保证及跨宽度超参数迁移的 MOGA 优化器，并在 GPT-2 和 LLaMA 的大规模预训练中展现出比 Muon 更优的效率与稳定性。

Ruihan Xu, Jiajin Li, Yiping LuWed, 11 Ma🤖 cs.LG

Online Neural Networks for Change-Point Detection

本文提出了两种基于神经网络和在线学习的变化点检测方法，它们具有线性计算复杂度，在合成及真实数据集上的实验表明其性能优于现有方法，并证明了算法的收敛性及其在特定条件下优于离线方法的优势。

Mikhail Hushchyn, Kenenbek Arzymatov, Denis DerkachTue, 10 Ma🤖 cs.LG