stat.ME 篇论文 | Gist.Science

AgroDesign: A Design-Aware Statistical Inference Framework for Agricultural Experiments in Python

AgroDesign 是一个基于 Python 的统计推断框架，通过将实验设计作为核心规范，自动将结构化农业试验（如随机区组、裂区及多环境试验）转化为有效的线性模型，从而消除手动建模的主观性并确保统计推断的准确性与可重复性。

Adaptive Active Learning for Online Reliability Prediction of Satellite Electronics

本文提出了一种融合改进维纳过程退化模型与两阶段自适应主动学习采样策略的在线可靠性预测框架，有效解决了卫星电子系统因数据稀缺、工况多变及个体差异导致的预测难题，显著提升了预测精度并降低了数据需求。

Shixiang Li, Yubin Tian, Dianpeng Wang, Piao Chen, Mengying RenWed, 11 Ma🤖 cs.LG

Distribution-free screening of spatially variable genes in spatial transcriptomics

该论文提出了一种基于新型准似然比统计量（MM-test）和 Knockoff 程序的非参数空间可变基因筛选方法，该方法利用空间距离等辅助信息，在控制错误发现率的同时，能够高效处理二维及三维空间转录组数据，并在理论与实证层面均展现出优于现有方法的性能。

Changhu Wang, Qiyun Huang, Zihao Chen, Jin Liu, Ruibin XiWed, 11 Ma📊 stat

Contrastive Bayesian Inference for Unnormalized Models

该论文提出了一种基于噪声对比估计的完全贝叶斯推断框架，通过将归一化常数视为未知参数并利用 Pólya-Gamma 数据增强技术，实现了无需调参即可对未归一化模型进行有效推断和不确定性量化。

Naruki Sonobe, Shonosuke Sugasawa, Daichi Mochihashi, Takeru MatsudaWed, 11 Ma📊 stat

Anomaly detection using surprisals

该论文提出了一种基于“惊奇度”（surprisal）及其尾部概率的统一定义框架，通过结合经验估计与极值理论，将复杂数据的异常检测转化为对惊奇度分布上尾的估计，从而在模型误设情况下有效识别包括低密度间隙中的“内点”异常。

Rob J Hyndman, David T. FrazierWed, 11 Ma📊 stat

MM-algorithms for traditional and convex NMF with Tweedie and Negative Binomial cost functions and empirical evaluation

本文提出了一种基于 MM 算法的统一框架，用于在 Tweedie 和负二项分布等更广泛的噪声假设下推导传统及凸非负矩阵分解（NMF）的乘性更新规则，并通过实证研究验证了该框架在处理过离散数据及大规模类别场景下的优越性。

Elisabeth Sommer James, Asger Hobolth, Marta PelizzolaWed, 11 Ma🤖 cs.LG

A Unified Hierarchical Multi-Task Multi-Fidelity Framework for Data-Efficient Surrogate Modeling in Manufacturing

本文提出了一种基于高斯过程的统一分层多任务多保真度（H-MT-MF）框架，通过联合建模任务间相似性与保真度依赖性，有效解决了制造系统代理建模中数据需求大及多源异构数据利用不足的问题，显著提升了预测精度。

Manan Mehta, Zhiqiao Dong, Yuhang Yang, Chenhui ShaoWed, 11 Ma🤖 cs.LG

A Bayesian adaptive enrichment design using aggregate historical data to inform individualized treatment recommendations

本文提出了一种利用归一化幂先验整合外部汇总历史数据（如平均治疗效应）的贝叶斯自适应富集设计，旨在解决亚组特异性参数不可识别的问题，从而在阻塞性睡眠呼吸暂停等试验中实现更高效的个体化治疗推荐，并显著提升统计功效、缩短试验周期及减少样本量。

Lara Maleyeff, Shirin Golchi, Erica E. M. MoodieWed, 11 Ma📊 stat

Nuisance Function Tuning and Sample Splitting for Optimally Estimating a Doubly Robust Functional

该论文通过结合样本分割策略与对 nuisance 函数估计器的特定平滑调整（欠平滑或过平滑），证明了在低正则性条件下，传统的 plug-in 估计量和一阶偏差修正估计量均能实现双重鲁棒泛函的极小极大收敛速率。

Sean McGrath, Rajarshi MukherjeeTue, 10 Ma🔢 math

Geodesic slice sampling on the sphere

本文提出了一种针对球面上概率分布的高效无调参测地线切片采样算法，并通过理论证明与数值实验表明，该方法在混合性及复杂目标分布（如刚体配准问题）上的采样性能优于随机游走 Metropolis-Hastings 和哈密顿蒙特卡洛等标准采样器。

Michael Habeck, Mareike Hasenpflug, Shantanu Kodgirwar, Daniel RudolfTue, 10 Ma🔢 math

Estimating Treatment Effects under Algorithmic Interference: A Structured Neural Networks Approach

该论文针对在线内容平台因算法竞争导致的实验干扰问题，提出了一种结合算法选择与用户响应模型的半参数结构化框架，通过扩展双重机器学习理论来构建无偏估计量，从而准确评估算法全局推广效果并纠正传统估计量的严重偏差。

Ruohan Zhan, Shichao Han, Yuchen Hu, Zhenling JiangTue, 10 Ma🤖 cs.LG

Adaptive Transfer Clustering: A Unified Framework

本文提出了一种名为自适应迁移聚类（ATC）的统一框架，该算法通过优化偏差 - 方差分解，能够在主数据集与辅助数据集存在未知差异的情况下自动利用共性，从而在包括高斯混合模型在内的多种统计模型中实现最优的聚类效果并量化迁移收益。

Yuqi Gu, Zhongyuan Lyu, Kaizheng WangTue, 10 Ma🤖 cs.LG

Doubly-Robust Functional Average Treatment Effect Estimation

本文提出了一种名为 DR-FoS 的新方法，用于在观测研究中估计具有双重稳健性的函数平均处理效应（FATE），该方法在结果或处理分配模型之一设定错误时仍能保持一致性估计，并证明了其收敛于高斯过程以实现全域有效推断，同时通过模拟和 SHARE 数据集实证验证了其优越性能。

Lorenzo Testa, Tobia Boschi, Francesca Chiaromonte, Edward H. Kennedy, Matthew ReimherrTue, 10 Ma🔢 math

Fast confidence bounds for the false discovery proportion over a path of hypotheses

本文提出了一种新算法，利用参考族的森林结构特性，将计算递增假设路径上假发现比例后验界的时间复杂度从 $O(|\mathcal{K}|m^2)$ 降低至 $O(|\mathcal{K}|m)$ ，从而实现了对整条曲线的高效快速计算。

Guillermo Durand (LMO, CELESTE)Tue, 10 Ma🔢 math

StablePCA: Distributionally Robust Learning of Shared Representations from Multi-Source Data

本文提出了名为 StablePCA 的分布鲁棒框架，旨在从多源高维数据中提取共享的低维表示，并通过凸松弛与镜像近端算法解决其非凸优化难题，同时提供了评估松弛紧致性的数据依赖证书。

Zhenyu Wang, Molei Liu, Jing Lei, Francis Bach, Zijian GuoTue, 10 Ma🤖 cs.LG

The Poisson tensor completion parametric estimator

本文提出了一种利用样本间关系进行低秩泊松张量分解的泊松张量补全（PTC）估计器，通过将直方图分箱识别为非均匀泊松过程来实现对均值测度的补全，从而在无需额外非负约束的情况下，显著优于针对次高斯分布的标准直方图估计器。

Daniel M. Dunlavy, Richard B. Lehoucq, Carolyn D. Mayer, Arvind PrasadanTue, 10 Ma🔢 math

Correlation of divergency: c-delta. Being different in a similar way or not

本文介绍了一种名为 c-delta 的自定义统计系数，旨在通过量化两组数据内部发散模式的相似性（而非传统的相关性），为量子物理、遗传学及机器学习等领域提供一种评估变异结构相似性的新视角。

Johan F. HoornTue, 10 Ma⚛️ quant-ph

Sigmoid-FTRL: Design-Based Adaptive Neyman Allocation for AIPW Estimators

本文提出了名为 Sigmoid-FTRL 的自适应实验设计方法，通过同时最小化两个凸 regret 来解决 AIPW 估计器在基于设计的设定下非凸优化的挑战，证明了其 Neyman 遗憾达到 $T^{-1/2}R$ 的极小极大最优收敛速率，并建立了相应的中心极限定理与方差估计器以支持渐近有效的置信区间构建。

Fangyi Chen, Shu Ge, Jian Qian, Christopher HarshawTue, 10 Ma🔢 math

Conformal Tradeoffs: Guarantees Beyond Coverage

该论文针对部署中的共形预测器，提出了超越边际覆盖率保障的运营认证与规划框架，通过小样本 Beta 修正、独立审计集校准及几何特征分析，在有限时间窗口内为系统的承诺频率、推迟决策及错误暴露等关键运营指标提供明确的有限样本保证与帕累托权衡分析。

Petrus H. ZwartTue, 10 Ma🤖 cs.LG

Order-Induced Variance in the Moving-Range Sigma Estimator: A Total-Variance Decomposition

该论文通过引入随机排列并应用全方差定律，将移动极差估计量的方差精确分解为与顺序无关的数值分量（基于样本基尼平均差）和与顺序相关的相邻分量，从而在正态分布假设下揭示了其相对于样本标准差估计量的效率损失主要源于相邻效应。

Andrew T. KarlTue, 10 Ma🔢 math