math.ST 篇论文 | Gist.Science

Integrating Heterogeneous Information in Randomized Experiments: A Unified Calibration Framework

本文提出了一种统一的校准框架，通过凸优化定义的校准权重整合随机化实验中的异质信息（如辅助协变量、机器学习预测及外部数据），在确保估计有效性的同时实现了无效率损失的方差缩减，并推广至分层数与信息源数量随样本量增长的渐近理论。

Wei Ma, Zeqi Wu, Zheng ZhangTue, 10 Ma🔢 math

Quadratic form of heavy-tailed self-normalized random vector with applications in $\alpha$ -heavy Mar\v cenko--Pastur law

该论文研究了重尾自归一化随机向量的二次型渐近分布，证明了在轻尾条件下对角元主导极限律，并据此推导了重尾样本相关矩阵的 $\alpha$ -重马尔琴科 - 帕斯图尔律的隐式表示及其无原子性质。

Zhaorui Dong, Johannes Heiny, Jianfeng YaoTue, 10 Ma🔢 math

Maximal Ancillarity, Semiparametric Efficiency, and the Elimination of Nuisances

本文从 Hajek-Le Cam 渐近视角出发，通过定义局部渐近极大无关子 $\sigma$ -域序列，证明了半参数有效估计量可基于由测度传输导出的中心向外残差秩与符号构建，从而在不估计干扰参数的情况下实现有限样本的干扰消除，同时保持半参数效率界。

Marc Hallin, Bas J. M. Werker, Bo ZhouTue, 10 Ma🔢 math

Dirichlet kernel density estimation on the simplex with missing data

本文提出了一种基于逆概率加权与自适应狄利克雷核的非参数密度估计方法，用于处理缺失数据下的单纯形成分数据，该方法不仅具备优良的大样本性质，且在模拟与 NHANES 白细胞数据应用中表现优于基于对数比变换的传统方法。

Hanen Daayeb, Wissem Jedidi, Salah Khardani, Guanjie Lyu, Frédéric OuimetTue, 10 Ma🔢 math

Probabilistic Inference and Learning with Stein's Method

这篇专著全面概述了基于Stein方法的概率推断与学习的理论与方法，详细阐述了Stein算子与Stein集的构建、Stein差异的性质及其与Stein变分梯度下降的联系，并提供了严谨的定义、结果及证明参考。

Qiang Liu, Lester Mackey, Chris OatesTue, 10 Ma🤖 cs.LG

Group-Sparse Smoothing for Longitudinal Models with Time-Varying Coefficients

本文提出了一种名为 TV-Select 的统一框架，通过结合 B 样条近似与双重惩罚机制（组 Lasso 与光滑惩罚），在纵向数据变系数模型中同时实现变量选择以及区分效应是时变还是恒定的结构识别，从而在避免过拟合的同时提升估计精度与预测性能。

Yu Lu, Tianni Zhang, Yuyao Wang, Mengfei RanTue, 10 Ma🔢 math

Testing for Endogeneity: A Moment-Based Bayesian Approach

本文利用指数倾斜经验似然框架，提出了一种用于检验线性回归模型中解释变量内生性的贝叶斯因子方法，该方法在频率学派意义下具有一致性，并通过模拟数据及汽车需求与机票价格等实证案例验证了其有效性。

Siddhartha Chib, Minchul Shin, Anna SimoniTue, 10 Ma🔢 math

Reject, Resample, Repeat: Understanding Parallel Reasoning in Language Model Inference

本文通过粒子滤波（如序贯蒙特卡洛）的视角，为语言模型推理中的并行采样方法建立了理论框架，揭示了采样误差与奖励评估次数之间的非渐近关系，并指出了该方法在理论保证与最终准确率之间的根本局限。

Noah Golowich, Fan Chen, Dhruv Rohatgi, Raghav Singhal, Carles Domingo-Enrich, Dylan J. Foster, Akshay KrishnamurthyTue, 10 Ma🤖 cs.LG

Estimation of differential entropy for normal populations under prior information

本文研究了在顺序限制先验信息下，两个正态总体微分熵的点估计与区间估计问题，推导了多种估计量并证明了其优于最佳仿射等价估计量的改进性，同时通过数值模拟和实际案例验证了所提方法的性能。

Somnath Mandal, Lakshmi Kanta PatraTue, 10 Ma🔢 math

Post-Hoc Large-Sample Statistical Inference

本文建立了一套渐近后验推断理论，提出了比现有非渐近方法假设更弱且更精确的渐近后验置信集和 p 值，从而解决了传统统计推断中显著性水平必须预先设定的局限性。

Ben Chugg, Etienne Gauthier, Michael I. Jordan, Aaditya Ramdas, Ian Waudby-SmithTue, 10 Ma🔢 math

The W-footrule coefficient: A copula-based measure of countermonotonicity

本文提出了一种基于 Copula 的负相关性度量—— $W$ -footrule 系数 $\Phi_C$ ，证明了其与 Spearman footrule 及 Gini 伽马的分解关系，并建立了该系数的秩估计量的强一致性与渐近正态性。

Enrique de Amo, David García-Fernández, Manuel Úbeda-FloresTue, 10 Ma🔢 math

Weighted Chernoff information and optimal loss exponent in context-sensitive hypothesis testing

该论文研究了带乘性权重函数的上下文敏感二元假设检验问题，通过引入加权几何混合分布并建立其指数族嵌入，推导出了最优总损失的对数渐近行为及其对应的加权 Chernoff 信息误差指数，并给出了高斯和泊松等具体模型的显式表达式。

Mark Kelbert, El'mira Yu. KalimulinaTue, 10 Ma🔢 math

Sign Identifiability of Causal Effects in Stationary Stochastic Dynamical Systems

该论文在已知因果结构但扩散矩阵未知的连续时间线性平稳随机微分方程框架下，通过引入边符号可识别性概念，在忠实性假设下建立了判断一般图结构边符号可识别性、不可识别性及部分可识别性的准则，并针对经典与新型循环因果结构进行了具体验证。

Gijs van Seeventer, Saber SalehkaleybarTue, 10 Ma🤖 cs.LG

Size-Location Correlation for Set-Valued Processes: Theory, Estimation, and Laws of Large Numbers under $\rho$ -Mixing

该论文提出了一种基于支撑函数偶奇分解的变分框架，用于分析凸紧随机集的大小与位置相关性，定义了具有几何解释性的协方差与相关指标及 $\rho$ -混合系数，并在弱平稳性条件下建立了大数定律，从而有效解决了传统方法在处理中心对称集时的退化问题并实现了方向性依赖与尺寸效应的解耦。

Tuyen Luc TriTue, 10 Ma🔢 math

Limiting Spectral Distribution of moderately large Kendall's correlation matrix and its application

本文建立了在维度增长慢于样本量且观测值独立但不一定同分布的中等高维情形下，Kendall 相关矩阵的极限谱分布理论，并提出了利用该理论检测高维数据依赖性的图形工具，指出忽略分布异质性可能导致虚假的依赖性检测。

Raunak Shevade, Monika BhattacharjeeTue, 10 Ma🔢 math

Minimax estimation for Varying Coefficient Model via Laguerre Series

本文提出了一种基于拉盖尔级数的变系数模型估计方法，该方法在拉盖尔 - 索伯列夫空间下实现了系数函数的极小极大最优收敛速率，并建立了估计量的渐近正态性、置信区间及点态假设检验，同时通过模拟和实证研究验证了其有限样本性能及优越性。

Rida Benhaddou, Khalid Chokri, Jackson PinschenatTue, 10 Ma🔢 math

Bayesian inference of planted matchings: Local posterior approximation and infinite-volume limit

本文研究了在一维空间下两个相关随机点集之间隐藏匹配的贝叶斯推断问题，证明了在部分匹配模型中后验分布可由局部算法近似且边际统计量存在热力学极限，而在精确匹配模型中则需先进行全局排序并引入“流”的概念来定义极限，同时指出将结果推广至高维仍是未解难题。

Zhou Fan, Timothy L. H. Wee, Kaylee Y. YangTue, 10 Ma🔢 math

Asymptotics of cut distributions and robust modular inference using Posterior Bootstrap

本文从渐近角度研究了用于阻断错误模型信息传播的截断分布，推导了 Bernstein-von Mises 定理和带有定量界限的拉普拉斯近似，并提出了一种基于后验 Bootstrap 的算法，使其生成的可信区间具备名义上的频率渐近覆盖率。

Emilia Pompe, Pierre E. Jacob, Mikołaj J. KasprzakThu, 12 Ma📊 stat

The Inverse Problem for Single Trajectories of Rough Differential Equations

本文旨在为离散观测的随机粗糙微分方程建立统计推断框架，通过定义连续逆问题并构建基于离散逆问题序列收敛的几何 $p$ -粗糙路径解，提出了一种利用路径签名表示的迭代数值算法，证明了该算法在 $p$ -变差拓扑下对局部梯度的同步更新具有关于观测步长的一致收敛性。

Thomas Morrish, Theodore Papamarkou, Anastasia Papavasiliou, Yang ZhaoThu, 12 Ma📊 stat

Response time central-limit and failure rate estimation for stationary periodic rate monotonic real-time systems

本文提出了一种针对平稳周期性速率单调实时系统的方法，通过利用响应时间的中心极限定理并结合逆高斯混合分布的重新参数化与自适应 EM 算法来估算故障率，仿真结果表明该方法能有效近似故障率并适用于实时系统的扩展分析。

Kevin Zagalo, Avner Bar-HenThu, 12 Ma⚡ eess

math.ST